C++ `__builtin_expect` (likely/unlikely)：分支预测优化技巧 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

C++ `__builtin_expect`：让编译器猜猜你的心，分支预测优化技巧

各位观众，晚上好！欢迎来到“编译器读心术”特别讲座！我是今天的讲师，江湖人称“Bug终结者”。今天我们要聊一个非常有趣，但又有点“玄学”的东西：C++ 中的 __builtin_expect。

啥？你没听过？没关系，今天之后，你就能用它来“调戏”编译器，让它更好地优化你的代码，让程序跑得更快！

一、什么是__builtin_expect？

简单来说，__builtin_expect 是一个编译器内置函数，它不是标准的 C++ 语法，而是 GCC 和 Clang 等编译器提供的扩展。它的作用是告诉编译器：你认为某个条件表达式的结果更有可能是真，还是假。

就像你在玩猜大小的游戏，你悄悄告诉庄家：“我觉得这把肯定是大！”，庄家听了你的话，就会做相应的准备，如果真如你所料，他就赢麻了！__builtin_expect 就扮演了你和庄家的角色，你（程序员）告诉编译器（庄家）你的预测，编译器根据你的预测来优化代码。

二、为什么要用__builtin_expect？

这就要提到一个很重要的概念：分支预测。

现代 CPU 为了提高效率，会采用流水线技术。流水线就像工厂里的生产线，可以同时处理多个指令。但是，当遇到条件分支（比如 if 语句）时，CPU 就面临一个选择：走哪条路？

如果 CPU 猜对了，那就万事大吉，流水线继续顺畅地运行。但如果猜错了，CPU 就需要清空流水线，重新从正确的路径开始执行，这会造成很大的性能损失，被称为“分支预测失败”。

__builtin_expect 的作用就是帮助 CPU 更好地进行分支预测。通过告诉编译器哪个分支更可能发生，编译器就可以调整指令的顺序，将更可能执行的代码放在更“容易”执行的地方，从而减少分支预测失败的概率，提高程序的性能。

三、 __builtin_expect 怎么用？

__builtin_expect 的基本语法如下：

long __builtin_expect (long exp, long c);

exp：要预测的条件表达式。
c：你认为 exp 最可能的值。通常是 0 (false) 或 1 (true)。

返回值就是 exp 的值，所以可以直接用在条件判断中。

举个例子：

假设我们有一个函数，用来处理错误情况：

void handle_error(int error_code) {
  // 处理错误的逻辑
  std::cerr << "Error occurred! Code: " << error_code << std::endl;
}

void process_data(int data) {
  if (data < 0) {
    handle_error(1); // 错误情况
  } else {
    // 处理正常数据
    std::cout << "Processing data: " << data << std::endl;
  }
}

在这个例子中，data < 0 的情况通常很少发生，大部分情况下 data 都是大于等于 0 的。我们可以使用 __builtin_expect 来告诉编译器：

void process_data(int data) {
  if (__builtin_expect(data < 0, 0)) { // 告诉编译器，data < 0 的概率很小
    handle_error(1); // 错误情况
  } else {
    // 处理正常数据
    std::cout << "Processing data: " << data << std::endl;
  }
}

这样，编译器就会认为 data >= 0 的情况更可能发生，会将 else 分支的代码放在更“容易”执行的地方，比如放在更靠近 if 语句的位置，或者进行其他的优化。

四、更友好的宏定义

直接使用 __builtin_expect 看起来不太直观，我们可以定义一些宏来让代码更易读：

#define likely(x)   __builtin_expect(!!(x), 1)
#define unlikely(x) __builtin_expect(!!(x), 0)

likely(x)：表示 x 很可能为真。
unlikely(x)：表示 x 很可能为假。

注意，这里使用了 !!(x) 将 x 转换为布尔值。

使用这些宏，代码就变得更清晰了：

void process_data(int data) {
  if (unlikely(data < 0)) { // 告诉编译器，data < 0 的概率很小
    handle_error(1); // 错误情况
  } else {
    // 处理正常数据
    std::cout << "Processing data: " << data << std::endl;
  }
}

五、适用场景

__builtin_expect 在以下场景中特别有用：

错误处理： 错误情况通常很少发生，可以使用 unlikely 来标记。
循环优化： 循环的结束条件通常很少满足，可以使用 unlikely 来标记。
性能关键代码： 在性能要求很高的代码中，可以使用 likely 和 unlikely 来引导编译器进行优化。
高频分支 vs 低频分支： 当代码中有明显的高频分支和低频分支时，可以使用 likely 和 unlikely 来标记。

六、使用注意事项

过度使用： 不要滥用 __builtin_expect。只有在你能确定某个分支的概率明显高于其他分支时才应该使用它。过度使用反而可能导致性能下降，因为编译器可能会过度优化，导致代码变得复杂，反而降低了执行效率。
编译器支持： __builtin_expect 不是标准的 C++ 语法，所以你需要使用支持它的编译器，比如 GCC 和 Clang。
性能测试： 使用 __builtin_expect 并不保证一定能提高性能。最好进行性能测试，验证你的优化是否有效。
可读性： 虽然 likely 和 unlikely 宏可以提高代码的可读性，但也要注意代码的整体清晰度。不要为了使用 __builtin_expect 而牺牲代码的可读性。
数据驱动： 最好基于实际数据来判断哪个分支更可能发生。不要凭空猜测。可以使用性能分析工具来收集数据，然后根据数据来决定是否使用 __builtin_expect。

七、实例分析

例子 1：循环优化

假设我们有一个函数，用来在一个数组中查找一个元素：

int find_element(int arr[], int size, int target) {
  for (int i = 0; i < size; ++i) {
    if (arr[i] == target) {
      return i;
    }
  }
  return -1; // 没找到
}

在这个例子中，循环的结束条件 i < size 通常会一直满足，直到循环结束。我们可以使用 unlikely 来标记循环的结束条件：

int find_element(int arr[], int size, int target) {
  for (int i = 0; unlikely(i < size); ++i) { // 告诉编译器，i < size 的概率很高
    if (arr[i] == target) {
      return i;
    }
  }
  return -1; // 没找到
}

注意： 这个例子仅仅为了演示unlikely的用法。在实际循环中，直接对循环变量使用unlikely通常没有意义，甚至可能适得其反。因为编译器会尝试优化循环体，而不是循环条件本身。更常见的优化方式是循环展开、向量化等。

例子 2：错误处理

假设我们有一个函数，用来读取文件：

bool read_file(const std::string& filename, std::string& content) {
  std::ifstream file(filename);
  if (!file.is_open()) {
    // 处理打开文件失败的情况
    std::cerr << "Failed to open file: " << filename << std::endl;
    return false;
  }

  std::stringstream buffer;
  buffer << file.rdbuf();
  content = buffer.str();
  return true;
}

在这个例子中，打开文件失败的情况通常很少发生，我们可以使用 unlikely 来标记：

bool read_file(const std::string& filename, std::string& content) {
  std::ifstream file(filename);
  if (unlikely(!file.is_open())) { // 告诉编译器，打开文件失败的概率很小
    // 处理打开文件失败的情况
    std::cerr << "Failed to open file: " << filename << std::endl;
    return false;
  }

  std::stringstream buffer;
  buffer << file.rdbuf();
  content = buffer.str();
  return true;
}

例子 3：边界条件判断

int get_value(int arr[], int index, int default_value) {
  if (unlikely(index < 0 || index >= arr_size)) {
    return default_value;
  }
  return arr[index];
}

八、 __builtin_expect 的替代方案

虽然 __builtin_expect 很有用，但它不是标准的 C++ 语法。如果你的代码需要在不同的编译器上编译，并且你不想依赖编译器扩展，可以考虑使用一些替代方案：

Profile-Guided Optimization (PGO)： PGO 是一种更高级的优化技术，它通过收集程序运行时的信息，来指导编译器进行优化。PGO 可以自动识别哪些分支更可能发生，并进行相应的优化，而不需要你手动使用 __builtin_expect。
代码重构： 有时候，可以通过重构代码来避免分支预测问题。例如，可以将高频分支和低频分支分离到不同的函数中，或者使用查找表来代替条件判断。
编译器优化选项： 编译器通常提供一些优化选项，可以自动进行分支预测优化。例如，GCC 和 Clang 提供了 -O3 选项，可以进行更激进的优化。

九、总结

__builtin_expect 是一个强大的工具，可以帮助你优化代码，提高程序的性能。但是，它也不是万能的。在使用 __builtin_expect 时，需要谨慎考虑，避免过度使用，并且要进行性能测试，验证你的优化是否有效。

记住，编程就像谈恋爱，要了解你的对象（编译器），才能更好地配合，写出更高效的代码！

十、扩展阅读

为了更深入地了解 __builtin_expect 和分支预测优化，建议阅读以下资料：

GCC documentation on __builtin_expect: https://gcc.gnu.org/onlinedocs/gcc/Other-Builtins.html
Clang documentation: 搜索 __builtin_expect
相关书籍和论文：关于编译器优化、分支预测和性能分析的书籍和论文。

表格总结：__builtin_expect vs 其他优化方法

特性	`__builtin_expect`	Profile-Guided Optimization (PGO)	代码重构	编译器优化选项
精度	手动指定，可能不准确	基于运行时数据，更准确	取决于重构质量	自动，精度一般
易用性	简单，但需要理解原理	复杂，需要收集和使用 profile data	取决于重构难度	简单
可移植性	非标准，依赖编译器	不同编译器支持程度不同	高	高
运行时开销	无	收集 profile data 有运行时开销	无	无
适用场景	手动优化特定分支	自动优化整个程序	优化特定代码结构	自动优化整个程序

最后，给大家留一个小作业：

请你尝试使用 __builtin_expect 来优化你自己的代码，并进行性能测试，看看是否真的提高了性能。

今天的讲座就到这里，感谢大家的聆听！希望大家以后都能成为“编译器读心术”大师，写出更高效、更优雅的代码！谢谢！

C++ __builtin_expect：让编译器猜猜你的心，分支预测优化技巧

发表回复 取消回复

C++ `__builtin_expect`：让编译器猜猜你的心，分支预测优化技巧

发表回复取消回复