C++ Compiler Explorer (Godbolt) 高阶用法：逆向分析编译器优化策略 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

哈喽，各位好！今天咱们聊点刺激的——用 Compiler Explorer（也就是 Godbolt）来逆向分析编译器的优化策略。这就像是扒开编译器的底裤，看看它到底在搞什么鬼，把我们的代码优化成了什么妖魔鬼怪。

Compiler Explorer 是个啥玩意儿？

如果你还不知道 Compiler Explorer 是什么，赶紧去补课！简单来说，它是一个在线工具，你输入 C++ 代码，它就能实时显示编译后的汇编代码。这玩意儿对于理解编译器的行为、学习汇编语言、甚至 debug 代码都非常有帮助。

为啥要逆向分析编译器优化？

知己知彼，百战不殆： 了解编译器如何优化你的代码，才能写出更易于编译器优化的代码，避免它犯傻。
性能调优： 深入理解编译器的行为，可以帮助你找到代码中的性能瓶颈，并进行针对性优化。
学习汇编语言： Compiler Explorer 是学习汇编语言的绝佳工具，通过观察编译后的汇编代码，你可以了解 C++ 代码是如何被翻译成机器指令的。
Debug 神器： 当你的代码出现奇怪的 bug 时，观察编译后的汇编代码，可能会发现一些隐藏的错误。
纯粹的好奇心： 满足你那颗探索编译器内部运作机制的好奇心。

准备工作

打开 Compiler Explorer：https://godbolt.org/
选择 C++ 编译器（例如：GCC、Clang、MSVC）。
选择编译选项（例如：-O3、-Os、-Og）。-O3 是最激进的优化级别，-Os 是针对代码大小的优化，-Og 是针对 debug 友好的优化。
写一些 C++ 代码。

开始逆向分析

接下来，咱们通过几个例子，来演示如何使用 Compiler Explorer 逆向分析编译器的优化策略。

例子 1：循环展开（Loop Unrolling）

循环展开是一种常见的优化技术，它可以减少循环的迭代次数，从而提高程序的执行效率。

#include <iostream>

int main() {
  int sum = 0;
  for (int i = 0; i < 4; ++i) {
    sum += i;
  }
  std::cout << sum << std::endl;
  return 0;
}

在 Compiler Explorer 中，选择 -O3 优化级别，你会看到类似以下的汇编代码：

  xor eax, eax
  add eax, 1
  add eax, 2
  add eax, 3
  mov esi, eax
  mov edi, OFFSET FLAT:_ZSt4cout
  mov edx, esi
  call std::ostream::operator<<(int)
  ...

可以看到，编译器并没有生成循环的汇编代码，而是直接将循环展开，计算出结果。这大大提高了程序的执行效率。

如果将循环次数改为100，编译器可能会选择部分展开，而不是完全展开，以避免代码膨胀。

例子 2：内联函数（Inline Function）

内联函数是一种将函数调用替换为函数体本身的优化技术，它可以减少函数调用的开销。

#include <iostream>

inline int add(int a, int b) {
  return a + b;
}

int main() {
  int x = 10;
  int y = 20;
  int z = add(x, y);
  std::cout << z << std::endl;
  return 0;
}

在 Compiler Explorer 中，选择 -O3 优化级别，你会看到类似以下的汇编代码：

  mov esi, 30
  mov edi, OFFSET FLAT:_ZSt4cout
  mov edx, esi
  call std::ostream::operator<<(int)
  ...

可以看到，编译器并没有生成函数调用的汇编代码，而是直接将 add(x, y) 替换为 30。这就是内联函数的效果。

例子 3：常量折叠（Constant Folding）

常量折叠是一种在编译时计算常量表达式的优化技术，它可以减少程序在运行时的计算量。

#include <iostream>

int main() {
  int result = 2 + 3 * 4;
  std::cout << result << std::endl;
  return 0;
}

在 Compiler Explorer 中，选择 -O3 优化级别，你会看到类似以下的汇编代码：

  mov esi, 14
  mov edi, OFFSET FLAT:_ZSt4cout
  mov edx, esi
  call std::ostream::operator<<(int)
  ...

编译器直接将 2 + 3 * 4 计算为 14，并将结果存储在 esi 寄存器中。

例子 4：死代码消除（Dead Code Elimination）

死代码消除是一种删除程序中永远不会被执行的代码的优化技术，它可以减少程序的体积。

#include <iostream>

int main() {
  int x = 10;
  if (false) {
    x = 20;
  }
  std::cout << x << std::endl;
  return 0;
}

在 Compiler Explorer 中，选择 -O3 优化级别，你会看到类似以下的汇编代码：

  mov esi, 10
  mov edi, OFFSET FLAT:_ZSt4cout
  mov edx, esi
  call std::ostream::operator<<(int)
  ...

编译器发现 if (false) 永远不会执行，因此将 x = 20; 这行代码删除。

例子 5：自动向量化（Auto-vectorization）

自动向量化是一种将标量操作转换为向量操作的优化技术，它可以利用 SIMD 指令（例如：SSE、AVX）来提高程序的执行效率。

#include <iostream>

int main() {
  int a[4] = {1, 2, 3, 4};
  int b[4] = {5, 6, 7, 8};
  int c[4];
  for (int i = 0; i < 4; ++i) {
    c[i] = a[i] + b[i];
  }
  for (int i = 0; i < 4; ++i) {
    std::cout << c[i] << " ";
  }
  std::cout << std::endl;
  return 0;
}

在 Compiler Explorer 中，选择 -O3 优化级别，并启用 AVX 指令集（例如：-mavx2），你会看到类似以下的汇编代码：

  vmovdqu ymm0, YMMWORD PTR [rsi]
  vmovdqu ymm1, YMMWORD PTR [rdx]
  vpaddd  ymm0, ymm0, ymm1
  vmovdqu YMMWORD PTR [rdi], ymm0
  ...

可以看到，编译器使用了 AVX 指令 vpaddd 来同时计算 4 个整数的加法。这就是自动向量化的效果。

表格总结常见优化策略

优化策略	描述	优点	缺点
循环展开	减少循环的迭代次数，增加每次迭代执行的代码量。	减少循环开销，提高程序的执行效率。	增加代码体积，可能导致指令缓存失效。
内联函数	将函数调用替换为函数体本身。	减少函数调用的开销，提高程序的执行效率。	增加代码体积，可能导致指令缓存失效。
常量折叠	在编译时计算常量表达式。	减少程序在运行时的计算量，提高程序的执行效率。	无
死代码消除	删除程序中永远不会被执行的代码。	减少程序的体积，提高程序的执行效率。	无
自动向量化	将标量操作转换为向量操作，利用 SIMD 指令。	提高程序的执行效率，尤其是在处理大量数据时。	需要硬件支持 SIMD 指令，对代码的可读性有一定影响。
尾调用优化	如果函数 `A` 的最后一个操作是调用函数 `B`，编译器可以将函数 `A` 的栈帧复用给函数 `B`，从而避免创建新的栈帧。	减少函数调用的开销，避免栈溢出。	尾调用优化需要满足一定的条件，例如函数 `A` 在调用函数 `B` 之后不能再使用任何局部变量。
公共子表达式消除	如果一个表达式在程序的多个地方被重复计算，编译器可以将该表达式的值缓存起来，避免重复计算。	减少程序的计算量，提高程序的执行效率。	无
寄存器分配	将变量存储在寄存器中，而不是内存中。	减少内存访问的开销，提高程序的执行效率。	寄存器的数量有限，编译器需要进行合理的分配。
分支预测优化	预测分支的走向，从而避免流水线停顿。	提高程序的执行效率。	如果分支预测错误，会导致流水线停顿，降低程序的执行效率。

更高级的技巧

查看不同的编译器版本： Compiler Explorer 允许你选择不同的编译器版本，你可以观察不同版本编译器的优化策略差异。
使用不同的编译选项： 尝试不同的编译选项，例如 -O0、-O1、-O2、-O3、-Os、-Og，观察它们对汇编代码的影响。
分析复杂的代码： 尝试分析更复杂的代码，例如 STL 容器、算法等，了解编译器是如何优化这些代码的。
阅读汇编代码注释： Compiler Explorer 允许你添加汇编代码注释，方便你理解汇编代码的含义。
对比不同的代码实现： 尝试用不同的方式实现同一个功能，然后观察编译器是如何优化这些不同的实现的。

注意事项

汇编代码可能很复杂： 汇编代码的可读性比较差，需要一定的汇编语言基础才能理解。
编译器优化策略会不断变化： 不同的编译器版本，甚至相同的编译器版本，在不同的编译选项下，优化策略都可能不同。
不要过度优化： 过度优化可能会导致代码可读性降低，增加维护成本，甚至可能引入 bug。
以实际效果为准： 最终的优化效果取决于具体的应用场景，需要进行实际测试才能确定。

总结

Compiler Explorer 是一个强大的工具，它可以帮助我们深入理解编译器的优化策略，从而写出更易于编译器优化的代码，提高程序的执行效率。但是，逆向分析编译器优化需要一定的汇编语言基础和耐心，需要不断学习和实践。

希望今天的分享对大家有所帮助！记住，编译器不是黑盒，它只是一个程序，我们可以通过 Compiler Explorer 来理解它的行为，并利用它来优化我们的代码。祝大家编程愉快！

发表回复 取消回复

发表回复取消回复