C++ 代码压缩技术：减小可执行文件大小的编译与链接技巧

哈喽，各位好！今天咱们来聊聊一个挺实在的问题：C++ 代码压缩技术，也就是如何让你的可执行文件瘦身！毕竟，谁也不想自己的程序肥得跟个河马似的，占着硬盘空间不说，加载速度也慢吞吞的。

咱们的重点是编译和链接这两个环节，因为它们是影响可执行文件大小的关键因素。准备好了吗？Let’s dive in!

第一部分：编译优化，小身材大能量

编译阶段，编译器会把你的C++代码翻译成机器码。通过一些优化选项，我们可以让编译器生成更紧凑、更高效的机器码，从而减小可执行文件的大小。

优化级别：-O2 或 -O3，冲鸭！

编译器通常提供不同的优化级别，从 -O0（无优化）到 -O3（最高级别优化）。-O2 和 -O3 是比较常用的选择。它们会进行诸如内联函数、循环展开、删除无用代码等优化，从而提高代码效率，并通常也能减小可执行文件的大小。
- -O0：啥都不做，原汁原味。
- -O1：稍微优化一下，不费啥劲。
- -O2：用力优化，性价比高。
- -O3：拼命优化，可能会有副作用（例如编译时间增加）。
使用方法（以 GCC/G++ 为例）：
```
g++ -O2 your_code.cpp -o your_program
```
或者
```
g++ -O3 your_code.cpp -o your_program
```
注意： -O3 有时候可能会导致代码行为改变，或者编译时间过长。所以，建议先用 -O2 试试，如果效果不明显再考虑 -O3。
链接时代码生成 (Link-Time Code Generation, LTCG) / 链接时优化 (Link-Time Optimization, LTO)

LTCG/LTO 是一种更高级的优化技术，它在链接阶段进行优化。这意味着编译器可以跨越多个源文件进行优化，从而获得更好的效果。
- 原理： 编译器会把所有编译单元的中间代码（通常是 bitcode）交给链接器，链接器可以对整个程序进行分析和优化。
- 优势：
  - 可以内联跨模块的函数。
  - 可以删除未使用的全局变量和函数。
  - 可以进行更激进的优化。
- 缺点：
  - 编译时间会显著增加。
  - 需要更多的内存。
  - 调试可能会更困难。
使用方法（以 GCC/G++ 为例）：
```
g++ -O2 -flto your_code.cpp -o your_program
```
或者，分成编译和链接两步：
```
g++ -O2 -flto -c your_code.cpp -o your_code.o
g++ -O2 -flto your_code.o -o your_program
```
注意： -flto 标志需要在编译和链接阶段都加上。
Profile-Guided Optimization (PGO)：让编译器更懂你的代码

PGO 是一种基于性能剖析的优化技术。它通过运行程序，收集程序的性能数据，然后根据这些数据来指导编译器进行优化。
- 原理： 编译器会根据程序的实际运行情况，对代码进行优化，例如内联频繁调用的函数，优化热点代码。
- 步骤：
  1. 编译： 使用 -fprofile-generate 选项编译代码。
  2. 运行： 运行编译后的程序，生成性能数据文件。
  3. 重新编译： 使用 -fprofile-use 选项和性能数据文件重新编译代码。
- 优势：
  - 可以针对程序的实际运行情况进行优化。
  - 通常可以获得比 -O3 更好的性能。
- 缺点：
  - 需要运行程序来收集性能数据。
  - 如果性能数据不能代表程序的典型使用情况，优化效果可能会不佳。
使用方法（以 GCC/G++ 为例）：
```
# 1. 编译
g++ -fprofile-generate your_code.cpp -o your_program

# 2. 运行
./your_program  # 运行程序，生成 .gcda 文件

# 3. 重新编译
g++ -fprofile-use your_code.cpp -o your_program
```
函数内联 (Function Inlining)：展开你的翅膀

函数内联是指将函数调用替换为函数体本身。这可以减少函数调用的开销，并允许编译器进行更进一步的优化。
- 编译器自动内联： 编译器会自动内联一些小型、频繁调用的函数。
- inline 关键字： 可以使用 inline 关键字来建议编译器内联函数。但是，编译器不一定会采纳你的建议。
```
inline int add(int a, int b) {
    return a + b;
}

int main() {
    int result = add(1, 2); // 编译器可能会将 add(1, 2) 替换为 1 + 2
    return 0;
}
```
- LTO 的作用： LTO 可以跨模块进行函数内联，这意味着即使函数定义在不同的源文件中，也可以进行内联。
消除无用代码 (Dead Code Elimination)：清理你的房间

编译器会自动删除程序中未使用的代码，例如未调用的函数、未使用的变量等。
- 作用： 减小可执行文件的大小，提高代码效率。
- LTO 的作用： LTO 可以删除跨模块的无用代码。

使用更小的整数类型：能省则省

如果你的变量不需要存储很大的值，尽量使用更小的整数类型，例如 int8_t、int16_t 等。

#include <cstdint>

int main() {
    int8_t age = 25; // 年龄通常不会超过 127
    int16_t score = 1000; // 分数通常不会超过 32767
    return 0;
}

模板代码优化：减少重复

模板代码可能会导致代码膨胀，因为编译器会为每个模板实例生成一份代码。
- 减少模板参数的数量： 尽量使用通用的模板参数，避免为每个不同的类型都生成一份代码。
- 使用类型擦除 (Type Erasure)： 可以使用类型擦除技术来减少模板代码的膨胀。

第二部分：链接瘦身，精打细算

链接阶段，链接器会将编译后的目标文件（.o 文件）合并成一个可执行文件。通过一些技巧，我们可以让链接器生成更小的可执行文件。

去除调试信息 (Strip)：卸掉你的伪装

调试信息（例如函数名、行号等）对于调试程序很有用，但是它们会增加可执行文件的大小。在发布程序时，可以去除调试信息。
- 使用 strip 命令：
```
strip your_program
```
- 编译时去除调试信息：
```
g++ -O2 -s your_code.cpp -o your_program
```
  或者
```
g++ -O2 -Wl,-s your_code.cpp -o your_program
```
  -s 选项会去除符号表和调试信息。-Wl,-s 是将 -s 选项传递给链接器。
使用静态链接 (Static Linking)：打包你的家当

静态链接是指将程序依赖的库的代码直接嵌入到可执行文件中。
- 优势：
  - 可执行文件可以独立运行，不需要依赖外部库。
  - 可以避免库的版本冲突问题。
- 缺点：
  - 可执行文件的大小会增加。
  - 如果多个程序都使用同一个静态库，每个程序都会包含一份库的代码，导致磁盘空间的浪费。
- 使用方法（以 GCC/G++ 为例）：
```
g++ -static your_code.cpp -o your_program
```
注意： 静态链接可能会导致一些问题，例如许可证问题。在使用静态链接之前，请确保你了解相关的许可证条款。
去除未使用的库函数 (Link-Time Garbage Collection)：丢掉你的垃圾

链接器可以自动去除程序中未使用的库函数。
- 使用 -Wl,--gc-sections 选项：
```
g++ -O2 -Wl,--gc-sections your_code.cpp -o your_program
```
  这个选项会告诉链接器去除未使用的代码段。
- 需要和 -ffunction-sections 和 -fdata-sections 选项一起使用：
```
g++ -O2 -ffunction-sections -fdata-sections -Wl,--gc-sections your_code.cpp -o your_program
```
  -ffunction-sections 和 -fdata-sections 选项会将每个函数和每个数据项放到单独的代码段中，这样链接器才能更精确地去除未使用的代码。
使用 UPX 或其他可执行文件压缩工具：最后的疯狂

UPX (Ultimate Packer for eXecutables) 是一种常用的可执行文件压缩工具。它可以将可执行文件压缩到原来的 50%-70%。
- 原理： UPX 会对可执行文件进行压缩，并在运行时解压缩。
- 使用方法：
```
upx your_program
```
- 缺点：
  - 会增加程序的启动时间。
  - 可能会被一些杀毒软件误报。
避免使用不必要的库：简洁至上

只包含你真正需要的库。避免包含那些你只用了一小部分功能的庞大库。如果可以，考虑自己实现那些简单的功能，而不是依赖外部库。

第三部分：代码层面的优化，从细节入手

除了编译和链接的优化之外，我们还可以从代码层面入手，来减小可执行文件的大小。

减少全局变量的使用：局部才是王道

全局变量会增加可执行文件的大小，因为它们需要在程序的整个生命周期内都存在。尽量使用局部变量，或者将全局变量声明为 static。
```
// 不好的例子
int global_variable = 10;

int main() {
    // ...
    return 0;
}

// 更好的例子
int main() {
    int local_variable = 10;
    // ...
    return 0;
}
```
避免使用 RTTI (Runtime Type Information)：不必要的身份验证

RTTI 允许在运行时获取对象的类型信息。但是，RTTI 会增加可执行文件的大小。如果你的程序不需要 RTTI，可以禁用它。
- 使用 -fno-rtti 选项：
```
g++ -O2 -fno-rtti your_code.cpp -o your_program
```
避免使用异常处理 (Exception Handling)：平稳着陆

异常处理会增加可执行文件的大小，因为编译器需要生成额外的代码来处理异常。如果你的程序不需要异常处理，可以禁用它。
- 使用 -fno-exceptions 选项：
```
g++ -O2 -fno-exceptions your_code.cpp -o your_program
```
使用更高效的数据结构和算法：事半功倍

选择合适的数据结构和算法可以减少代码的复杂度和代码量，从而减小可执行文件的大小。
代码复用：能偷懒就偷懒

尽量复用代码，避免重复编写相同的代码。可以使用函数、类、模板等来实现代码复用。

第四部分：总结与建议

优化技术	优点	缺点	适用场景
`-O2` / `-O3`	提高代码效率，减小可执行文件大小	`-O3` 可能会导致代码行为改变，编译时间增加	几乎所有场景
LTO	可以内联跨模块的函数，删除未使用的全局变量和函数，进行更激进的优化	编译时间会显著增加，需要更多的内存，调试可能会更困难	大型项目，需要极致的性能优化
PGO	可以针对程序的实际运行情况进行优化，通常可以获得比 `-O3` 更好的性能	需要运行程序来收集性能数据，如果性能数据不能代表程序的典型使用情况，优化效果可能会不佳	对性能要求极高的场景，例如游戏开发
`strip`	减小可执行文件大小	去除调试信息，调试会更困难	发布程序
静态链接	可执行文件可以独立运行，不需要依赖外部库，可以避免库的版本冲突问题	可执行文件的大小会增加，如果多个程序都使用同一个静态库，每个程序都会包含一份库的代码，导致磁盘空间的浪费	需要独立运行的程序，例如嵌入式系统
`-Wl,--gc-sections`	去除未使用的库函数	需要和 `-ffunction-sections` 和 `-fdata-sections` 选项一起使用	几乎所有场景
UPX	减小可执行文件大小	会增加程序的启动时间，可能会被一些杀毒软件误报	对可执行文件大小有严格要求的场景，例如网络传输
减少全局变量的使用	减小可执行文件大小	可能会增加代码的复杂度	几乎所有场景
禁用 RTTI 和异常处理	减小可执行文件大小	会限制程序的功能	确定不需要 RTTI 和异常处理的场景

一些建议：

先易后难： 先尝试 -O2、strip 等简单的优化，如果效果不明显再考虑 LTO、PGO 等更高级的优化。
谨慎使用 -O3： -O3 可能会导致代码行为改变，或者编译时间过长。
测试！测试！测试！ 优化后一定要进行充分的测试，确保程序的行为没有改变。
根据实际情况选择优化技术： 不同的优化技术适用于不同的场景。要根据程序的实际情况选择合适的优化技术。
不要过度优化： 过度优化可能会导致代码难以维护，甚至会引入新的 bug。

好了，今天的分享就到这里。希望这些技巧能帮助你让你的 C++ 程序瘦身成功！记住，代码优化是一个持续的过程，需要不断学习和实践。祝大家编程愉快！

发表回复 取消回复

发表回复取消回复