C++ 内存顺序（Memory Order）：原子操作与并发正确性保证 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

C++ 内存顺序：原子操作与并发正确性保证（讲座模式）

大家好！欢迎来到今天的“C++ 并发编程进阶”讲座。今天我们要聊一个听起来高深莫测，但实际上是你构建稳定、高效并发程序的基石——C++ 内存顺序（Memory Order）。

我知道，一听到“内存顺序”，很多人就开始头疼了。感觉像是在研究量子力学，充满了不确定性和玄学。别怕！我会用最通俗易懂的方式，加上大量的代码示例，带你一步步揭开它的神秘面纱。

1. 为什么要关心内存顺序？

想象一下，你在厨房做饭，你的朋友也在厨房洗碗。你们共享一些资源，比如水龙头。如果你们不协调好，可能就会出现“抢水龙头”的情况，导致混乱。

在并发编程中，多个线程就像你和你的朋友，共享内存就像厨房。如果没有合适的同步机制，就会出现各种问题：

数据竞争（Data Race）： 多个线程同时访问并修改同一块内存，导致结果不可预测。
伪共享（False Sharing）： 即使线程修改不同的变量，但这些变量恰好位于同一个缓存行，也会导致性能下降。
编译器优化问题： 编译器为了提高效率，可能会重新排列代码的执行顺序，导致并发程序出现意想不到的错误。
CPU 乱序执行问题： 现代CPU为了提高效率，可能会乱序执行指令，导致并发程序出现意想不到的错误。

而内存顺序，就是用来解决这些问题的“协调者”。它告诉编译器和 CPU，哪些操作必须按照特定顺序执行，从而保证并发程序的正确性和性能。

2. 原子操作：并发编程的基石

在我们深入内存顺序之前，先来了解一下原子操作。原子操作就像一个“事务”，要么全部完成，要么全部不完成。它不会被其他线程中断。

C++ 提供 <atomic> 头文件，里面包含了一系列的原子类型，比如 atomic_int、atomic_bool 等。

#include <iostream>
#include <atomic>
#include <thread>

std::atomic_int counter = 0;

void increment_counter() {
    for (int i = 0; i < 100000; ++i) {
        counter++; // 原子加操作
    }
}

int main() {
    std::thread t1(increment_counter);
    std::thread t2(increment_counter);

    t1.join();
    t2.join();

    std::cout << "Counter value: " << counter << std::endl; // 预期结果：200000
    return 0;
}

在这个例子中，counter++ 是一个原子加操作。即使多个线程同时执行，也能保证 counter 的最终结果是正确的。如果没有原子操作，counter 的结果很可能小于 200000。

3. 内存顺序的六种类型（划重点！）

C++ 提供了六种内存顺序，它们定义了原子操作与其他操作之间的同步关系：

std::memory_order_relaxed (Relaxed)： 最宽松的顺序。只保证原子性，不保证任何同步或顺序。
std::memory_order_consume (Consume)： 用于读操作。当前线程的后续读操作依赖于该原子读操作的结果。
std::memory_order_acquire (Acquire)： 用于读操作。保证当前线程能够看到其他线程在该原子写操作之前的所有操作。
std::memory_order_release (Release)： 用于写操作。保证当前线程的所有写操作在该原子写操作之前完成，并且对其他线程可见。
std::memory_order_acq_rel (Acquire-Release)： 用于读-修改-写操作（比如 fetch_add）。同时具有 acquire 和 release 的特性。
std::memory_order_seq_cst (Sequentially Consistent)： 最强的顺序。保证所有线程看到的原子操作的顺序都是一致的，就像所有操作都按照一个全局时钟排序一样。

4. 内存顺序详解：从宽松到严格

让我们逐个分析这些内存顺序，并用代码示例来加深理解。

4.1 std::memory_order_relaxed (Relaxed)

这是最简单、最快速的内存顺序。它只保证原子操作的原子性，不提供任何同步保证。这意味着，编译器和 CPU 可以自由地重新排列使用 relaxed 顺序的原子操作，只要它们仍然是原子的。

#include <iostream>
#include <atomic>
#include <thread>

std::atomic_int x = 0;
std::atomic_int y = 0;

void thread1() {
    x.store(1, std::memory_order_relaxed);
    y.store(2, std::memory_order_relaxed);
}

void thread2() {
    int a = y.load(std::memory_order_relaxed);
    int b = x.load(std::memory_order_relaxed);
    std::cout << "a = " << a << ", b = " << b << std::endl;
}

int main() {
    std::thread t1(thread1);
    std::thread t2(thread2);

    t1.join();
    t2.join();

    return 0;
}

在这个例子中，thread2 可能打印出以下任何一种结果：

a = 2, b = 1
a = 0, b = 1
a = 2, b = 0
a = 0, b = 0

因为 relaxed 顺序不提供任何同步保证，thread2 可能在 thread1 存储 x 和 y 之前或之后加载它们。

使用场景：

计数器：多个线程可以安全地增加计数器，但不需要保证计数器的值对所有线程都立即可见。
统计信息：收集一些非关键的统计信息，允许一些数据丢失或不一致。

4.2 std::memory_order_consume (Consume)

consume 用于读操作。它建立了一种“依赖关系”，保证当前线程的后续读操作依赖于该原子读操作的结果。

注意： consume 在现代编译器和 CPU 上几乎没有实际效果，通常会被提升为 acquire。

4.3 std::memory_order_acquire (Acquire)

acquire 用于读操作。它保证当前线程能够看到其他线程在该原子写操作之前的所有操作。就像你进入一间房间，必须先“获取”房间的控制权，才能看到房间里所有的东西。

#include <iostream>
#include <atomic>
#include <thread>

std::atomic_bool ready = false;
int data = 0;

void thread1() {
    data = 42;
    ready.store(true, std::memory_order_release);
}

void thread2() {
    while (!ready.load(std::memory_order_acquire)); // 等待 ready 变为 true
    std::cout << "Data: " << data << std::endl; // 保证看到 data = 42
}

int main() {
    std::thread t1(thread1);
    std::thread t2(thread2);

    t1.join();
    t2.join();

    return 0;
}

在这个例子中，thread2 使用 acquire 顺序读取 ready。这意味着，当 ready 变为 true 时，thread2 保证能够看到 thread1 在设置 ready 之前的所有操作，包括将 data 设置为 42。

使用场景：

锁的获取：当线程获取锁时，它必须能够看到其他线程在释放锁之前的所有操作。
条件变量的等待：当线程等待条件变量时，它必须能够看到其他线程在通知条件变量之前的所有操作。

4.4 std::memory_order_release (Release)

release 用于写操作。它保证当前线程的所有写操作在该原子写操作之前完成，并且对其他线程可见。就像你离开一间房间，必须先“释放”房间的控制权，才能让其他人进入。

#include <iostream>
#include <atomic>
#include <thread>

std::atomic_bool ready = false;
int data = 0;

void thread1() {
    data = 42;
    ready.store(true, std::memory_order_release);
}

void thread2() {
    while (!ready.load(std::memory_order_acquire)); // 等待 ready 变为 true
    std::cout << "Data: " << data << std::endl; // 保证看到 data = 42
}

int main() {
    std::thread t1(thread1);
    std::thread t2(thread2);

    t1.join();
    t2.join();

    return 0;
}

在这个例子中，thread1 使用 release 顺序存储 ready。这意味着，在 thread1 设置 ready 为 true 之前，它必须先完成所有其他写操作，包括将 data 设置为 42。

使用场景：

锁的释放：当线程释放锁时，它必须保证所有对共享资源的修改都已经完成，并且对其他线程可见。
条件变量的通知：当线程通知条件变量时，它必须保证所有相关状态的修改都已经完成，并且对等待线程可见。

4.5 std::memory_order_acq_rel (Acquire-Release)

acq_rel 用于读-修改-写操作。它同时具有 acquire 和 release 的特性。

#include <iostream>
#include <atomic>
#include <thread>

std::atomic_int counter = 0;

void increment_counter() {
    for (int i = 0; i < 100000; ++i) {
        counter.fetch_add(1, std::memory_order_acq_rel); // 原子加操作，同时具有 acquire 和 release 特性
    }
}

int main() {
    std::thread t1(increment_counter);
    std::thread t2(increment_counter);

    t1.join();
    t2.join();

    std::cout << "Counter value: " << counter << std::endl; // 预期结果：200000
    return 0;
}

在这个例子中，fetch_add 是一个原子加操作，同时具有 acquire 和 release 的特性。这意味着，每次执行 fetch_add 操作时，都会建立一个同步点，保证当前线程能够看到其他线程之前的操作，并且当前线程的操作对其他线程可见。

使用场景：

自旋锁：使用原子操作来实现自旋锁，需要同时具有 acquire 和 release 的特性。
复杂的原子操作：需要保证原子操作的顺序性和可见性。

4.6 std::memory_order_seq_cst (Sequentially Consistent)

这是最强的内存顺序。它保证所有线程看到的原子操作的顺序都是一致的，就像所有操作都按照一个全局时钟排序一样。

#include <iostream>
#include <atomic>
#include <thread>

std::atomic_int x = 0;
std::atomic_int y = 0;
std::atomic_int z = 0;

void thread1() {
    x.store(1, std::memory_order_seq_cst);
    y.store(1, std::memory_order_seq_cst);
}

void thread2() {
    while (y.load(std::memory_order_seq_cst) != 1);
    if (x.load(std::memory_order_seq_cst) == 0) {
        z.store(1, std::memory_order_seq_cst);
    }
}

void thread3() {
    while (x.load(std::memory_order_seq_cst) != 1);
    if (y.load(std::memory_order_seq_cst) == 0) {
        z.store(2, std::memory_order_seq_cst);
    }
}

int main() {
    std::thread t1(thread1);
    std::thread t2(thread2);
    std::thread t3(thread3);

    t1.join();
    t2.join();
    t3.join();

    std::cout << "z = " << z.load(std::memory_order_seq_cst) << std::endl; // z 只能是 0 或 1
    return 0;
}

在这个例子中，由于所有原子操作都使用了 seq_cst 顺序，所以所有线程看到的 x 和 y 的变化顺序都是一致的。这意味着，thread2 和 thread3 不可能同时进入 if 语句，所以 z 的值只能是 0 或 1。

使用场景：

调试：在调试并发程序时，可以使用 seq_cst 顺序来简化分析。
需要全局一致性：某些算法需要保证所有线程看到的原子操作顺序都是一致的。

5. 如何选择合适的内存顺序？

选择合适的内存顺序是一个权衡的过程。更强的顺序提供更强的同步保证，但也带来更高的性能开销。

一般来说，可以遵循以下原则：

默认使用 seq_cst： 在不确定时，使用 seq_cst 是最安全的选择。
尽可能使用更宽松的顺序： 如果你知道你的程序不需要那么强的同步保证，可以使用更宽松的顺序来提高性能。
理解你的硬件和编译器： 不同的硬件和编译器对内存顺序的实现可能有所不同。了解你的硬件和编译器可以帮助你做出更明智的选择。

下面是一个简单的表格，总结了各种内存顺序的特性：

内存顺序	同步保证	性能开销
`memory_order_relaxed`	只保证原子性，不保证任何同步或顺序。	最低
`memory_order_consume`	用于读操作。当前线程的后续读操作依赖于该原子读操作的结果。	较低
`memory_order_acquire`	用于读操作。保证当前线程能够看到其他线程在该原子写操作之前的所有操作。	中等
`memory_order_release`	用于写操作。保证当前线程的所有写操作在该原子写操作之前完成，并且对其他线程可见。	中等
`memory_order_acq_rel`	用于读-修改-写操作。同时具有 `acquire` 和 `release` 的特性。	较高
`memory_order_seq_cst`	最强的顺序。保证所有线程看到的原子操作的顺序都是一致的，就像所有操作都按照一个全局时钟排序一样。	最高

6. 总结

C++ 内存顺序是一个复杂但重要的主题。理解内存顺序可以帮助你编写更稳定、更高效的并发程序。

记住，选择合适的内存顺序是一个权衡的过程。你需要根据你的程序的具体需求，选择最合适的顺序。

希望今天的讲座对你有所帮助！如果你还有任何问题，欢迎提问。谢谢大家！

C++ 内存顺序：原子操作与并发正确性保证（讲座模式）

发表回复 取消回复

发表回复取消回复