C++ Linker Flags 优化：减小二进制文件大小与启动速度 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

好，让我们开始这场关于 C++ 链接器 (Linker) 优化的讲座。今天的主题是：如何通过调整链接器标志 (Linker Flags) 来减小二进制文件大小和提高程序启动速度。

开场白：链接器，幕后英雄？还是拖油瓶？

各位，大家好！欢迎来到今天的“链接器优化大作战”现场。我们都知道，C++ 代码写得再漂亮，最终都要经过编译、链接才能变成可执行文件。编译器的功劳大家都看得到，而链接器呢？它就像一个默默无闻的幕后英雄，把我们编译好的各个模块拼装在一起。

但是，有时候这个“英雄”也会变成“拖油瓶”，它可能会让我们的程序变得又大又慢。想象一下，你的代码明明只有几百行，编译出来的程序却有好几 MB，启动速度慢得像蜗牛，是不是很郁闷？

别担心！今天，我们就来扒一扒链接器的“黑历史”，看看如何通过调整链接器标志，让它乖乖地为我们服务，打造更小、更快的 C++ 程序。

第一幕：链接器的工作原理——知己知彼，百战不殆

在深入探讨优化策略之前，我们先来简单了解一下链接器的工作原理。

编译阶段 (Compilation)：编译器将每个 .cpp 文件编译成对应的目标文件 (.o 或 .obj)。这些目标文件包含了机器码、数据、符号表等信息。
链接阶段 (Linking)：链接器将所有目标文件以及需要的库文件（静态库 .a 或 .lib，动态库 .so 或 .dll）组合起来，解决符号引用（例如，函数调用、全局变量访问），最终生成可执行文件。

简单来说，链接器就像一个拼图大师，把各个目标文件拼成一个完整的程序。在这个过程中，它会做以下几件事情：

符号解析 (Symbol Resolution)：找到每个符号的定义。例如，如果你的代码中调用了 printf 函数，链接器会找到 printf 函数在标准库中的定义。
重定位 (Relocation)：调整代码和数据的地址，确保它们在程序运行时能够正确访问。
合并节 (Section Merging)：将相同类型的节（例如，.text 节包含代码，.data 节包含已初始化的数据）合并成一个更大的节。
库链接 (Library Linking)：将程序依赖的库文件链接到可执行文件中。

第二幕：链接器标志优化——兵来将挡，水来土掩

现在，我们进入正题：如何通过调整链接器标志来优化程序。

1. 代码大小优化：瘦身大法

移除未使用的代码 (Dead Code Elimination)：
- -Wl,--gc-sections (GCC/Clang)：这个标志告诉链接器，删除未使用的代码段 (sections)。使用这个选项需要编译器和链接器同时支持。通常，我们需要在编译时加上 -ffunction-sections 和 -fdata-sections 标志，将每个函数和数据放在单独的 section 中，这样链接器才能更精确地删除未使用的代码。
```
// 编译选项
g++ -c -O2 -ffunction-sections -fdata-sections main.cpp -o main.o
g++ -c -O2 -ffunction-sections -fdata-sections utils.cpp -o utils.o

// 链接选项
g++ main.o utils.o -o myprogram -Wl,--gc-sections
```
- /OPT:REF (MSVC)：MSVC 编译器对应的选项。同样，需要配合编译器选项 /Gy (Enable Function-Level Linking) 一起使用。
```
set(CMAKE_CXX_FLAGS_RELEASE "${CMAKE_CXX_FLAGS_RELEASE} /Gy /O2")
set(CMAKE_EXE_LINKER_FLAGS_RELEASE "${CMAKE_EXE_LINKER_FLAGS_RELEASE} /OPT:REF")
```
注意：在使用这些标志时，要小心误删除了程序实际需要的代码。特别是在使用动态链接库时，可能会因为某些函数没有被直接调用而导致被删除。
使用链接时优化 (Link-Time Optimization, LTO)：
- -flto (GCC/Clang)：LTO 允许编译器在链接时进行全局优化，可以更好地进行代码内联、常量传播、死代码删除等优化。
```
// 编译和链接选项
g++ -c -O2 -flto main.cpp -o main.o
g++ -c -O2 -flto utils.cpp -o utils.o
g++ main.o utils.o -o myprogram -flto
```
- /LTCG (MSVC)：MSVC 编译器对应的选项。
```
set(CMAKE_CXX_FLAGS_RELEASE "${CMAKE_CXX_FLAGS_RELEASE} /GL /O2")
set(CMAKE_EXE_LINKER_FLAGS_RELEASE "${CMAKE_EXE_LINKER_FLAGS_RELEASE} /LTCG")
```
原理：LTO 的核心思想是，在链接时将所有目标文件合并成一个大的中间表示 (Intermediate Representation, IR)，然后对这个 IR 进行全局优化。这样可以避免因为编译单元之间的信息隔离而导致的优化不足。

优点：LTO 可以显著减小代码大小，提高程序性能。
缺点：LTO 会增加编译时间和内存消耗。
剥离符号信息 (Stripping Symbols)：
- strip 命令 (Linux/macOS)：strip 命令可以从可执行文件中删除符号信息，减小文件大小。
```
strip myprogram
```
- /STRIP:ALL (MSVC)：MSVC 编译器对应的选项。
原理：符号信息主要用于调试，包含了函数名、变量名、行号等信息。在发布版本中，这些信息通常是不需要的，可以安全地删除。

优点：可以显著减小文件大小。
缺点：删除符号信息后，调试会变得更加困难。

技巧：可以保留一部分符号信息，例如，只保留函数名，方便调试。在 strip 命令中可以使用 --strip-debug 选项，在 MSVC 中可以使用 /PDBSTRIPPED 选项。

2. 启动速度优化：闪电启动

延迟加载动态链接库 (Delay-Loading DLLs)：
- -Wl,--delay-load=<dllname> (GCC/Clang)：这个标志告诉链接器，在程序启动时不要立即加载指定的动态链接库，而是在第一次使用该库中的函数时才进行加载。
```
// 链接选项
g++ main.o -o myprogram -Wl,--delay-load=mydll.dll
```
- /DELAYLOAD:<dllname> (MSVC)：MSVC 编译器对应的选项。
原理：有些动态链接库可能在程序启动时并不需要立即使用，延迟加载可以避免在启动时加载这些库，从而缩短启动时间。

优点：可以显著缩短启动时间，特别是当程序依赖的动态链接库很多时。
缺点：第一次使用延迟加载的库中的函数时，可能会出现短暂的延迟。
优化链接顺序 (Link Order)：
- 链接器按照指定的顺序链接目标文件和库文件。如果将程序启动时需要的代码放在前面链接，可以减少页面错误 (page faults)，提高启动速度。
```
// 链接选项
g++ startup.o core.o utils.o -o myprogram
```
原理：操作系统以页 (page) 为单位加载程序代码和数据。如果程序启动时需要的代码和数据分散在不同的页中，会导致频繁的页面错误，降低启动速度。通过优化链接顺序，可以将启动时需要的代码和数据放在相邻的页中，减少页面错误。

技巧：可以使用工具分析程序的启动过程，找出启动时需要的代码和数据，然后将包含这些代码和数据的目标文件放在前面链接。
避免不必要的依赖 (Unnecessary Dependencies)：
- 检查程序依赖的库文件，移除不必要的依赖。有时候，程序可能因为历史原因或者误配置而依赖了一些实际上并不需要的库文件。移除这些依赖可以减小程序大小和启动时间。
技巧：可以使用工具分析程序的依赖关系，找出不必要的依赖。例如，在 Linux 上可以使用 ldd 命令，在 Windows 上可以使用 Dependency Walker 工具。

3. 其他优化技巧：锦上添花

使用静态链接 (Static Linking)：
- -static (GCC/Clang)：这个标志告诉链接器，将程序依赖的库文件静态链接到可执行文件中。
```
// 链接选项
g++ main.o -o myprogram -static
```
原理：静态链接将库文件的代码复制到可执行文件中，程序运行时不需要依赖外部的库文件。

优点：可以避免因为缺少动态链接库而导致程序无法运行的问题，也可以提高程序的可移植性。
缺点：会增加可执行文件的大小，而且如果多个程序都静态链接了同一个库文件，会造成代码冗余。

适用场景：适合于需要独立运行或者对可移植性要求较高的程序。
使用链接器脚本 (Linker Script)：
- 链接器脚本可以控制链接器的行为，例如，指定目标文件的链接顺序、调整节的地址、定义符号等。
原理：链接器脚本是一个文本文件，包含了链接器的指令。通过修改链接器脚本，可以实现更高级的优化。

适用场景：适合于需要对链接过程进行精细控制的场景，例如，嵌入式系统开发。

第三幕：实战演练——纸上谈兵终觉浅，绝知此事要躬行

光说不练假把式，让我们来看一个简单的例子。

假设我们有一个程序 main.cpp，它调用了 utils.cpp 中的函数。

// main.cpp
#include <iostream>
#include "utils.h"

int main() {
    std::cout << "Hello, world!" << std::endl;
    int result = add(1, 2);
    std::cout << "1 + 2 = " << result << std::endl;
    return 0;
}

// utils.cpp
#include "utils.h"

int add(int a, int b) {
    return a + b;
}

int subtract(int a, int b) { // 未使用的函数
    return a - b;
}

// utils.h
#ifndef UTILS_H
#define UTILS_H

int add(int a, int b);
int subtract(int a, int b);

#endif

我们可以使用以下命令编译和链接这个程序：

g++ main.cpp utils.cpp -o myprogram

然后，我们可以使用以下命令优化这个程序：

g++ -c -O2 -ffunction-sections -fdata-sections main.cpp -o main.o
g++ -c -O2 -ffunction-sections -fdata-sections utils.cpp -o utils.o
g++ main.o utils.o -o myprogram -Wl,--gc-sections -flto
strip myprogram

通过这些优化，我们可以减小可执行文件的大小，并提高程序的启动速度。

第四幕：总结与展望——路漫漫其修远兮，吾将上下而求索

今天，我们一起探讨了如何通过调整链接器标志来优化 C++ 程序。我们学习了代码大小优化、启动速度优化以及其他一些有用的技巧。

但是，链接器优化是一个复杂而深入的领域，还有很多东西值得我们去探索。例如，如何使用自定义的链接器脚本来优化程序的内存布局、如何利用编译器的 profile-guided optimization (PGO) 来提高程序的性能等等。

希望今天的讲座能够帮助大家更好地理解链接器的工作原理，并掌握一些实用的优化技巧。记住，优化是一个持续不断的过程，我们需要不断学习和实践，才能打造出更小、更快、更强大的 C++ 程序。

结束语：愿你的程序像猎豹一样迅猛！

谢谢大家！希望你们的程序都能像猎豹一样迅猛，像小鸟一样轻盈！下课！

发表回复 取消回复

发表回复取消回复