Aexiar/c

Fork 0

mirror of https://github.com/Aexiar/c.git synced 2024-10-22 14:05:45 +02:00

许大仙 18f7da75ed 2024年10月9日 13:12

2024-10-09 05:12:09 +00:00

7.1 KiB

Raw Blame History

第一章：基本介绍

1.1 回顾 C 语言的编译过程

C 语言的编译过程，如下所示：

过程 ① ：编写（编辑）源代码，即：编写 C 语言源程序代码，并以文件的形式存储在磁盘中。

Note

源程序需要以 .c 作为扩展名。

过程 ② ：编译，即：将 C 语言源程序转换为目标程序（或目标文件）。如果程序没有错误，没有任何提示，就会生成一个扩展名为 .obj或 .o 的二进制文件。C 语言中的每条可执行语句经过编译之后，最终都会转换为二进制的机器指令。

Note

① 其实，编译阶段包含了预处理、编译和汇编。

② 预处理是编译过程的第一个阶段。在这个阶段，预处理器处理源代码中的指令（例如：#include、#define等），主要任务包括：

头文件包含：将头文件的内容插入到源文件中。例如：#include <stdio.h>会被替换为stdio.h文件的内容。

宏展开：替换宏定义。例如：#define PI 3.14会将代码中的PI替换为3.14。

条件编译：根据条件指令（如：#ifdef、#ifndef）有选择地编译代码。

删除代码中的注释，但是不会进行语法检查。

预处理完成后，生成一个扩展名为.i的中间文件。

③ 编译是将预处理后的源代码转换为汇编代码的过程。在这个阶段，编译器会检查代码的语法和语义，将其转换为目标机器的汇编语言，生成一个扩展名为.s的汇编文件。

④ 汇编是将汇编代码转换为机器代码（也称为目标代码或目标文件）的过程。在这个阶段，汇编器将汇编指令转换为二进制机器指令，生成一个扩展名为.o或 .obj的目标文件。

过程 ③ ：链接（连接），即：将编译形成的目标文件 *.obj 或 *.o和库函数以及其他目录文件链接，形成一个统一的二进制文件 *.exe。

Note

为什么需要链接库文件？

因为我们的 C 程序会使用 C 程序库中的内容，如：<stdio.h> 中的 printf() 函数，这些函数不是程序员自己写的，而是 C 程序库中提供的，因此需要链接。其实，在链接过程中，还会加入启动代码，这个启动代码（和系统相关，Linux 下主要有 crt0.c、crti.c 等，它们设置堆栈后，再调用 main() 函数）负责初始化程序运行时的环境。

过程 ④ ：执行，即：有了可执行的 *.exe文件，我们就可以在控制台上执行运行此 *.exe 文件。

Note

如果修改了源代码，还需要重新编译、链接，并生成新的 *.exe文件，再执行，方能生效。

1.2 和其他编程语言的对比

在编译和链接之前，C 语言需要对源文件进行一些文本方面的操作，如：删除代码中的注释，但是不会进行语法检查、头文件包含、宏展开、条件编译等，这个过程叫做预处理，由预处理程序（预处理器）完成。
较之其他的编程语言，如：Java 、C# 等，C/C++ 语言更依赖预处理器，所以在阅读或开发 C/C++ 程序的过程中，可能会接触到大量的预处理指令，如：#include、#define 等。

1.3 预处理指令

预处理过程中会执行预处理指令，预处理指令以 #开头，如：#include 等，用于指导预处理器执行不同的任务。
预处理器有如下的特点：
- ① 预处理指令应该放在代码的开头部分。
- ② 预处理指令都以 #开头，指令前面可以有空白字符（比如空格或制表符），#和指令的其余部分之间也可以有空格，但是为了兼容老的编译器，一般不留空格。
```
// 推荐写法
#include <stdio.h>
```
```
// 不推荐写法
    #include <stdio.h>
# include <stdio.h>
```
- ③ 预处理指令都是一行的，除非在行尾使用反斜杠，将其折行，但强烈不建议这么干。
```
#include <std\
io.h>
```
- ④ 预处理指令不需要分号作为结束符，指令结束是通过换行符来识别的。
```
#include <stdio.h>; // 这里有分号会报错
```
```
#define PI 3.14; // 分号会成为 PI 的值的一部分
```
- ⑤ 预处理指令通常不能写在函数内部，有些编译器的扩展允许将预处理指令写在函数里，但强烈不建议这么干。
```
int main () {
    // 一般不允许写在这里
    #include <stdio.h> // [!code warning]

    return 0;
}
```

1.4 为什么 C 语言需要预处理？

1.4.1 概述

在实际开发中，有的时候，我们希望自己编写的程序能够跨平台（操作系统）运行，但是可能每个平台提供的系统库函数不同，如：在 Windows 上实现暂停的函数是 void Sleep(DWORD dwMilliseconds)，单位是 ms，头文件是 <windows.h>；而 Linux 上实现暂停的函数是 unsigned int sleep (unsigned int seconds)，单位是 s ，头文件是 <unistd.h>。所以，我们希望在 Windows 上调用的是 Sleep() 函数，而在 Linux 上调用的是 sleep() 函数，怎么办？
这就需要在编译之前对源文件进行处理：如果检测到的平台是 Windows，就保留 Sleep() 函数而删除 sleep() 函数；反之，如果检测到的平台是 Linux，则保留 sleep() 函数而删除 Sleep() 函数。

Note

① 这些在编译之前对源文件进行简单加工的过程，就称为预处理，即：预先处理、提前处理。

② 之前提过，在 Windows 上推荐使用 MSYS2 ，就是因为 MSYS2 提供了一个兼容层，使得在 Windows 上可以使用类似于 Linux 的环境。并且，MSYS2 同时支持 Windows 和类 Unix 的库函数，对我们开发跨平台程序更为友好！！！

1.4.2 应用示例

需求：开发一个 C 语言程序，让它暂停 5 秒以后再输出内容，并且要求跨平台。

Note

不同平台下的暂停函数和头文件都不一样，如下所示：

① Windows 平台下的暂停函数的原型是void Sleep(DWORD dwMilliseconds)（注意 S 是大写的），参数的单位是 ms，位于 <windows.h> 头文件。

② Linux 平台下暂停函数的原型是unsigned int sleep (unsigned int seconds)，参数的单位是 s，位于 <unistd.h> 头文件。

示例：

#include <stdio.h>

// 不同的平台下引入不同的头文件
#if _WIN32 // 识别windows平台
#include <windows.h>
#elif __linux__ // 识别linux平台
#include <unistd.h>
#endif

int main() {
// 不同的平台下调用不同的函数
#if _WIN32 // 识别windows平台
    Sleep(5000);
#elif __linux__ // 识别linux平台
    sleep(5);
#endif

    puts("Hello World\n");

    return 0;
}

上述程序，在 Windows 上进行预处理，即：

gcc

7.1 KiB

Raw Blame History

第一章：基本介绍

1.1 回顾 C 语言的编译过程

1.2 和其他编程语言的对比

1.3 预处理指令

1.4 为什么 C 语言需要预处理？

1.4.1 概述

1.4.2 应用示例

第二章：宏定义

2.1 概述

第三章：带参数的宏定义

第四章：文件包含

第五章：条件编译

7.1 KiB Raw Blame History Unescape Escape

第一章：基本介绍

1.1 回顾 C 语言的编译过程

1.2 和其他编程语言的对比

1.3 预处理指令

1.4 为什么 C 语言需要预处理？

1.4.1 概述

1.4.2 应用示例

第二章：宏定义

2.1 概述

第三章：带参数的宏定义

第四章：文件包含

第五章：条件编译

7.1 KiB

Raw Blame History