background image

  现在以这个例子来讲解编译器的工作:

  1.预处理阶段:编译器以 C 文件作为一个单元,首先读这个 C 文件,发现第一句与
第二句是包含一个头文件,就会在所有搜索路径中寻找这两个文件,找到之后,就会将
相应头文件中再去处理宏,变量,函数声明,嵌套的头文件包含等,检测依赖关系,进
行宏替换,看是否有重复定义与声明的情况发生,最后将那些文件中所有的东东全部扫
描进这个当前的 C 文件中,形成一个中间"C 文件"

2.编译阶段,在上一步中相当于将那个头文件中的 test 变量扫描进了一个中间 C 文件,

那么 test 变量就变成了这个文件中的一个全局变量,此时就将所有这个中间 C 文件的所
有变量,函数分配空间,将各个函数编译成二进制码,按照特定目标文件格式生成目标
文件,在这种格式的目标文件中进行各个全局变量,函数的符号描述,将这些二进制码

 

按照一定的标准组织成一个目标文件

3.连接阶段,将上一步成生的各个目标文件,根据一些参数,连接生成最终的可执

行文件,主要的工作就是重定位各个目标文件的函数,变量等,相当于将个目标文件中
的二进制码按一定的规范合到一个文件中再回到 C 文件与头文件各写什么内容的话题上:
理论上来说 C 文件与头文件里的内容,只要是 C 语言所支持的,无论写什么都可以的,
比如你在头文件中写函数体,只要在任何一个 C 文件包含此头文件就可以将这个函数编
译成目标文件的一部分(编译是以 C 文件为单位的,如果不在任何 C 文件中包含此头文
件的话,这段代码就形同虚设),你可以在 C 文件中进行函数声明,变量声明,结构体
声明,这也不成问题!!!那为何一定要分成头文件与 C 文件呢?又为何一般都在头件
中进行函数,变量声明,宏声明,结构体声明呢?而在 C 文件中去进行变量定义,函数
实现呢??原因如下:

  1.如果在头文件中实现一个函数体,那么如果在多个 C 文件中引用它,而且又同时
编译多个 C 文件,将其生成的目标文件连接成一个可执行文件,在每个引用此头文件的
C 文件所生成的目标文件中,都有一份这个函数的代码,如果这段函数又没有定义成局
部函数,那么在连接时,就会发现多个相同的函数,就会报错

  2.如果在头文件中定义全局变量,并且将此全局变量赋初值,那么在多个引用此头
文件的 C 文件中同样存在相同变量名的拷贝,关键是此变量被赋了初值,所以编译器就
会将此变量放入 DATA 段,最终在连接阶段,会在 DATA 段中存在多个相同的变量,它
无法将这些变量统一成一个变量,也就是仅为此变量分配一个空间,而不是多份空间,

 

假定这个变量在头文件没有赋初值,编译器就会将之放入 BSS 段,连接器会对 BSS 段的
多个同名变量仅分配一个存储空间

  3.如果在 C 文件中声明宏,结构体,函数等,那么我要在另一个 C 文件中引用相应
的宏,结构体,就必须再做一次重复的工作,如果我改了一个 C 文件中的一个声明,那
么又忘了改其它 C 文件中的声明,这不就出了大问题了,程序的逻辑就变成了你不可想
象的了,如果把这些公共的东东放在一个头文件中,想用它的 C 文件就只需要引用一个
就 OK 了!!!这样岂不方便,要改某个声明的时候,只需要动一下头文件就行了

  4.在头文件中声明结构体,函数等,当你需要将你的代码封装成一个库,让别人来