C语言进阶:程序预处理

程序预处理

本章节研究的是,源代码文件test.c是如何一步步得到一个可执行程序test.exe的。在之前的学习中可知.c文件要先后经过编译链接成.exe文件再执行。

程序的编译链接运行如下图所示。翻译中编译又包括预编译、编译、汇编。

C语言进阶:程序预处理_第1张图片

编译链接执行三个步骤,都需要为其配置不同的环境。编译和链接在翻译环境中,而执行在运行环境中发生。

  • 翻译环境:在该环境中源代码被转换成可执行的机器指令。
  • 执行环境:用于实际执行代码。

程序的翻译环境

翻译阶段的大致流程如下图所示。

C语言进阶:程序预处理_第2张图片

组成一个程序的每个.c源文件都会被编译器编译,分别生成对应的.obj目标文件。多个目标文件以及引入的链接库被链接器链接在一起,形成一个单一的.exe可执行程序。

编译器即是一个用于编译代码的工具,在vs环境下为cl.exe的可执行程序。连接器则是用于链接所有目标文件的工具,在vs中为link.exe的可执行程序,链接库是标准中任何被该程序用到的函数。如图:

C语言进阶:程序预处理_第3张图片

而若想观察翻译代码过程中的每一个流程的具体细节,在集成开发环境vs中不便展示,当然我们可以使用Linux环境下的gcc编译器。

此次演示就采用加法函数,分别存放在两个文件test.cadd.c

//1. add.c
int Add(int x, int y)
{
     
	int sum = x + y;
	return sum;
}

//2. test.c
#include  
//声明函数
extern int Add(int x, int y);
int main()
{
     
	int a = 10;
	int b = 20;
	int ret = 0;
	ret = Add(a, b);
	printf("ret = %d\n", ret);
	return 0;
}
预编译

Linux环境下编写完test.c文件的代码后,输入gcc test.c -E可以将代码预编译的结果输出到屏幕上。还可以用gcc test.c -E -o test.i是将结果输出到文件test.i

预编译结果截图

#include,#define,#pragma的语句被称为预处理指令,还有注释文本的删除,都在此阶段完成替换。

所有可以看出预编译阶段的动作都是文本操作

  1. #include头文件的包含
  2. #define预处理符号的替换
  3. 删除注释

预编译,顾名思义,是在编译前删减代码中的不必要的与机器识别代码无关的内容。被称为文本操作

编译

对预编译产生的文件test.i再编译gcc test.i -S,会自动生成汇编代码test.s

编译结果汇编代码截图

故编译阶段是将C语言代码转化为汇编代码,这是整体现象。实际上会发生这四个动作:

  1. 词法分析,语法分析,语义分析

词法分析,语法分析,语义分析都是编译器识别语句的操作。重点是接下接下来的符号汇总。

  1. 符号汇总

符号汇总,是只对全局符号进行汇总,局部符号是不进行汇总的。目的是能够将所有文件中的代码组合到一起成一个完整的程序。如add.c文件中的函数名Add,还有test.c文件中的Addmain

汇编

gcc test.s -C将编译结束产生的汇编代码转化成了二进制指令(机器指令)存入二进制文件test.o中。

汇编阶段会形成符号表,因为机器在调用指令时需要知道其存放的位置,所谓符号表大概就是符号和其地址的集合。如图,可以假设:

C语言进阶:程序预处理_第4张图片

链接

链接将二进制指令目标文件test.o等,链接在一起形成可执行程序test.out。目标文件test.oelf格式文件,在Linux平台下可以用readelf翻译并查看其内容。

展示readelf信息段符号表

链接阶段的动作是:

  1. 合并段表

所谓的链接,就是将对应的段合并起来。

  1. 符号表的合并和重定位

符号表的合并,是将各自的符号表合并到一起。如test.o中的Add的无效地址,需把add.oAdd的地址合并过去再重定位到变量的真实地址,才是有意义的。

C语言进阶:程序预处理_第5张图片

从编译期间的符号汇总,到汇编时的形成符号表,再到链接时的合并和重定位符号表,都是为了最后生成可执行程序时能够找到并链接各个文件中的符号。

C语言进阶:程序预处理_第6张图片

程序的执行环境

  1. 程序首先载入内存

    有的机器上有操作系统,这个动作就是由操作系统完成,没有的由手工完成。

  2. 执行调用main函数

  3. 创建函数栈帧

    程序使用一个运行时堆栈,存储函数的局部变量和返回地址。

  4. 终止程序

    可以正常也可以意外终止程序。

程序的执行并不是本章的要点,所以就大概介绍一下。

你可能感兴趣的