C++ `[[likely]]` 和 `[[unlikely]]` (C++20)：显式提供分支预测提示 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

哈喽，各位好！今天我们要聊聊C++20里一对儿有趣的小伙伴：[[likely]] 和 [[unlikely]]。它们就像是编译器的小耳语者，让我们能告诉编译器，哪些分支代码更有可能执行，哪些不太可能。这样一来，编译器就可以针对我们的提示进行优化，从而提升程序的性能。

1. 分支预测：编译器的小九九

在深入[[likely]]和[[unlikely]]之前，我们先来了解一下分支预测。CPU执行指令的时候，可不是傻乎乎地一条一条等。它很聪明，会提前预测下一步要执行哪条指令。尤其是在遇到 if 语句、 switch 语句、循环等分支结构时，CPU会猜测哪个分支更有可能被执行。

如果CPU猜对了，那一切顺利，流水线继续happy地工作。但如果猜错了，那就要付出代价了！CPU需要把已经预取和执行的指令全部丢掉，重新从正确的指令开始执行，这会造成性能上的损失，我们称之为“分支预测失败”。

分支预测的准确性直接影响程序的性能。现代CPU的分支预测器已经相当厉害了，能根据历史执行情况和一些启发式规则进行预测。但是，有时候编译器和CPU也无法准确判断，这时候就需要我们出手相助了。

2. [[likely]] 和 [[unlikely]]：给编译器指明方向

[[likely]] 和 [[unlikely]] 就是C++20引入的两个属性(attribute)，它们用来告诉编译器，某个分支更有可能或更不可能被执行。

[[likely]]: 告诉编译器，这个分支很可能被执行。
[[unlikely]]: 告诉编译器，这个分支不太可能被执行。

3. 如何使用它们？

使用方法非常简单，直接把它们放在 if 语句、 switch 语句或循环语句的条件表达式前面。

#include <iostream>

int main() {
    int x = 5;

    if (x > 0) [[likely]] {
        std::cout << "x is positive" << std::endl;
    } else [[unlikely]] {
        std::cout << "x is not positive" << std::endl;
    }

    return 0;
}

在这个例子中，我们告诉编译器， x > 0 这个条件很可能为真。

4. 编译器会做什么？

编译器会根据我们的提示进行一些优化，例如：

指令排序： 编译器可能会把 [[likely]] 分支的代码放在更靠近条件判断的地方，这样CPU就能更快地取到指令，减少分支预测失败的概率。
代码布局： 编译器可能会把 [[unlikely]] 分支的代码放在比较远的地方，例如函数的末尾，或者单独的冷代码段，避免它影响主执行路径上的指令缓存。
生成条件移动指令： 在某些情况下，编译器可能会使用条件移动指令来代替分支，从而避免分支预测。

5. 适用场景和注意事项

[[likely]] 和 [[unlikely]] 并非万能药，只有在以下情况下才能发挥作用：

明确的概率倾向： 你需要对某个分支的执行概率有比较清晰的认识。如果概率不确定，或者每次运行都差不多，那使用它们可能反而会适得其反。
性能敏感的代码： 只有在对性能要求非常高的代码中，才值得考虑使用它们。对于一般的代码，编译器通常已经能做出很好的优化。
编译器支持： 确保你的编译器支持C++20的 [[likely]] 和 [[unlikely]] 属性。如果不支持，编译器会忽略它们，不会报错。

另外，还有一些需要注意的地方：

不要滥用： 不要随便给每个 if 语句都加上 [[likely]] 或 [[unlikely]] 。过度使用反而会干扰编译器的优化。
保持一致： 如果你的程序逻辑发生了变化，导致某个分支的执行概率发生了改变，一定要及时更新 [[likely]] 和 [[unlikely]] 的标注。
profile-guided optimization (PGO): [[likely]] 和 [[unlikely]] 是一种静态的提示。更高级的做法是使用 PGO，让编译器根据程序的实际运行情况进行优化。

6. 示例分析

下面我们来看几个更具体的例子，分析一下在什么情况下可以使用 [[likely]] 和 [[unlikely]]。

例子1：错误处理

在很多程序中，错误处理的代码通常只会在极少数情况下被执行。这时候，我们可以使用 [[unlikely]] 来告诉编译器。

int process_data(int data) {
    if (data < 0) [[unlikely]] {
        // 错误处理
        std::cerr << "Error: data is negative" << std::endl;
        return -1;
    }

    // 正常处理
    // ...
    return 0;
}

在这个例子中，我们假设 data < 0 的情况很少发生，所以用 [[unlikely]] 标注。

例子2：循环优化

在循环中，有些条件可能只在循环的开始或结束时才成立。这时候，我们可以使用 [[likely]] 或 [[unlikely]] 来优化循环。

void process_array(int arr[], int size) {
    for (int i = 0; i < size; ++i) {
        if (i == 0) [[unlikely]] {
            // 循环的第一次迭代
            // ...
        } else {
            // 其他迭代
            // ...
        }
    }
}

在这个例子中， i == 0 只会在循环的第一次迭代时成立，所以用 [[unlikely]] 标注。

例子3：缓存命中

在某些情况下，我们可以根据缓存的命中率来使用 [[likely]] 和 [[unlikely]]。例如，在一个查找函数中，如果缓存命中的概率很高，我们可以使用 [[likely]] 来标注缓存命中的分支。

int lookup_value(int key) {
    if (cache.contains(key)) [[likely]] {
        // 缓存命中
        return cache.get(key);
    } else {
        // 缓存未命中
        int value = calculate_value(key);
        cache.put(key, value);
        return value;
    }
}

7. 实验数据

为了更直观地了解 [[likely]] 和 [[unlikely]] 的效果，我们可以进行一些实验。下面是一个简单的实验，比较了使用和不使用 [[likely]] 和 [[unlikely]] 的性能差异。

#include <iostream>
#include <chrono>

const int ITERATIONS = 100000000;

int main() {
    int x = 0;
    auto start = std::chrono::high_resolution_clock::now();

    // Without likely/unlikely
    for (int i = 0; i < ITERATIONS; ++i) {
        if (i % 2 == 0) {
            x++;
        } else {
            x--;
        }
    }

    auto end = std::chrono::high_resolution_clock::now();
    auto duration = std::chrono::duration_cast<std::chrono::milliseconds>(end - start);
    std::cout << "Without likely/unlikely: " << duration.count() << " ms" << std::endl;

    x = 0;
    start = std::chrono::high_resolution_clock::now();

    // With likely/unlikely (assuming i % 2 == 0 is more likely for some reason)
    for (int i = 0; i < ITERATIONS; ++i) {
        if (i % 2 == 0) [[likely]] {
            x++;
        } else [[unlikely]] {
            x--;
        }
    }

    end = std::chrono::high_resolution_clock::now();
    duration = std::chrono::duration_cast<std::chrono::milliseconds>(end - start);
    std::cout << "With likely/unlikely: " << duration.count() << " ms" << std::endl;

    return 0;
}

注意： 这个实验的结果可能会受到多种因素的影响，例如编译器、CPU、优化选项等等。因此，最好在你的实际应用场景中进行测试，才能得到更准确的性能数据。

8. 表格总结

为了方便大家理解，我们用表格总结一下 [[likely]] 和 [[unlikely]] 的特点：

属性	作用	适用场景	注意事项
`[[likely]]`	告诉编译器，这个分支很可能被执行。	* 错误处理很少发生的情况	* 不要滥用
		* 循环中某个条件通常成立的情况	* 保持一致
		* 缓存命中率很高的情况	* Profile-Guided Optimization 可能是更好的选择
`[[unlikely]]`	告诉编译器，这个分支不太可能被执行。	* 错误处理经常发生的情况	* 不要滥用
		* 循环中某个条件很少成立的情况	* 保持一致
		* 缓存命中率很低的情况	* Profile-Guided Optimization 可能是更好的选择

9. 总结

[[likely]] 和 [[unlikely]] 是C++20提供的一对儿非常有用的工具，可以帮助我们优化程序的性能。但是，它们并非万能药，只有在合适的场景下才能发挥作用。在使用它们之前，一定要仔细分析你的代码，确保你对分支的执行概率有清晰的认识。并且要做好测试，观察它们是否真的带来了性能提升。

希望今天的讲解对大家有所帮助！记住，编程就像烹饪，掌握了各种调味料的特性，才能做出美味佳肴。 [[likely]] 和 [[unlikely]] 就是你工具箱里的两种特殊的调味料，好好利用它们，让你的代码更上一层楼！

发表回复 取消回复

发表回复取消回复