C/C++ 程序编译过程详解

2022-07-18 11:06:39

C/C++程序编译流程:

预处理->编译->汇编->链接

具体的就是:

源代码(source coprede)→预处理器(processor)→编译器(compiler)→汇编程序(assembler)→目标程序(object code)→链接器(Linker)→可执行程序(executables)

C语言在linux下的基本流程如图:

wKioL1cDsP_goUwlAAAlcbFkNbs906.png

1. 预处理

预处理相当于根据预处理指令组装新的C/C++程序。经过预处理,会产生一个没有宏定义,没有条件编译指令,没有特殊符号的输出文件,这个文件的含义同原本的文件无异,只是内容上有所不同。

  • 读取C/C++源程序,对其中的伪指令(以#开头的指令)进行处理

    ①将所有的“#define”删除,并且展开所有的宏定义

    ②处理所有的条件编译指令,如:“#if”、“#ifdef”、“#elif”、“#else”、“endif”等。这些伪指令的引入使得程序员可以通过定义不同的宏来决定编译程序对哪些代码进行处理。预编译程序将根据有关的文件,将那些不必要的代码过滤掉。

    ③处理“#include”预编译指令,将被包含的文件插入到该预编译指令的位置。

(注意:这个过程可能是递归进行的,也就是说被包含的文件可能还包含其他文件)

  • 删除所有的注释

  • 添加行号和文件名标识。

    以便于编译时编译器产生调试用的行号信息及用于编译时产生的编译错误或警告时能够显示行号

  • 保留所有的#pragma编译器指令

2. 编译

将预处理完的文件进行一系列词法分析、语法分析、语义分析及优化后,产生相应的汇编代码文件。

3. 汇编

将编译完的汇编代码文件翻译成机器指令,并生成可重定位目标程序的.o文件,该文件为二进制文件,字节编码是机器指令。

汇编器是将汇编代码转变成机器可以执行的指令,每一个汇编语句几乎都对应一条机器指令。所以汇编器的汇编过程相对于编译器来讲比较简单,它没有复杂的语法,也没有语义,也不需要做指令优化,只是根据汇编指令和机器指令的对照表一一翻译即可。

4. 链接

通过链接器将一个个目标文件(或许还会有库文件)链接在一起生成一个完整的可执行程序。

    由汇编程序生成的目标文件并不能立即就被执行,其中可能还有许多没有解决的问题。

将生成的.obj文件与库文件.lib等文件链接,生成可执行文件(.exe文件)

例如,某个源文件中的函数可能引用了另一个源文件中定义的某个符号(如变量或者函数调用等);在程序中可能调用了某个库文件中的函数,等等。所有的这些问题,都需要经链接程序的处理方能得以解决。

    链接程序的主要工作就是将有关的目标文件彼此相连接,也就是将在一个文件中引用的符号同该符号在另外一个文件中的定义连接起来,使得所有的这些目标文件成为一个能够被操作系统装入执行的统一整体。

linux 下使用g++ 进行编译步骤详解:

1.预处理 -E    (源文件->预处理文件)
g++   -E   hello.cpp   -o  hello.ii
-o 选项指定生成的文件,这一步若不指定,则会在终端输出预编译后的文件,所以最好指定下
后面几步的-o  也是同理,就是指生成指定文件
-E一定要大写,小写会报错

2.编译 -S      (预处理文件->汇编语言文件)
g++   -S  hello.ii
或者g++  -S  hello.cpp
默认生成hello.s,
-S必须大写,小写会报错

3.汇编 -c    (汇编语言文件->可重定向的目标文件(二进制形式))
g++  -c   hello.s
或者g++  -c  hello.cpp
默认生成 hello.o  目标文件,为乱码

4.链接    多个.o文件->可执行文件
比如有1.cpp,2.cpp
g++ -c  2.cpp     //生成2.o
g++ -c  1.cpp     //生成1.o
g++  1.o   2.o    -o   hello.out   //直接1.o 跟上2.o  ,用空格隔开即可,指定为hello
或者
g++  1.cpp   2.cpp  -o  hello.out
g++   *.o    -o   hello.out
g++   *.cpp   -o  hello.out

链接时有时会需要用-l 加入链接的第三方库,如g++  hello.o  -l  curl

总结:

正常情况就可以不用参数直接g++  hello.cpp 即可直接生成a.out ,而且这一步包含了上面4步
上面四步都可以直接操作hello.cpp 源文件
也可以通过makefile来编译:
可以参考:http://bbs.chinaunix.net/forum.php?mod=viewthread&tid=408225
https://www.cnblogs.com/wang_yb/p/3990952.html

1.dll .obj .lib使用在windows平台下

.dll:动态链接库,作为共享函数库的可执行文件
.obj:对象文件,相当于源代码对应的二进制文件,未经重定位
.lib:可理解为多个obj的集合,本质与.obj相同

2 .so .o .a使用在linux平台下

.so:(share object)动态链接库,跟Windows平台类似
.o: 对象文件,相当于源代码对应的二进制文件
.a: 与.o类似,多个.o的集合

  • 作者:Bird鸟人
  • 原文链接:https://blog.csdn.net/wcc27857285/article/details/84945519
    更新时间:2022-07-18 11:06:39