C++ `join()` 与 `detach()` 的区别与适用场景：何时等待，何时分离 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

各位听众，欢迎来到今天的“线程的爱恨情仇：join() 与 detach() 的选择与艺术”讲座！今天我们要聊聊C++多线程中两个至关重要的方法：join()和detach()。它们就像一对性格迥异的兄弟，一个黏人，一个洒脱，用错了地方，轻则程序效率低下，重则直接崩溃。

第一幕：线程的诞生与归宿

首先，我们得明白，线程是操作系统分配CPU时间的基本单元。在C++中，我们可以用std::thread来创建线程。线程一旦启动，就会执行我们指定的函数。但是，主线程（创建线程的线程）与子线程之间的关系，需要我们来管理。这就涉及到join()和detach()了。

#include <iostream>
#include <thread>
#include <chrono>

void worker_thread(int id) {
    std::cout << "Worker thread " << id << " started.n";
    std::this_thread::sleep_for(std::chrono::seconds(2)); // 模拟耗时操作
    std::cout << "Worker thread " << id << " finished.n";
}

int main() {
    std::cout << "Main thread started.n";

    std::thread t1(worker_thread, 1);
    std::thread t2(worker_thread, 2);

    // 在这里，我们必须决定是 join() 还是 detach()

    std::cout << "Main thread continues...n";
    std::cout << "Main thread finished.n";

    return 0;
}

在这个例子中，我们创建了两个子线程t1和t2。关键问题是，在main()函数结束之前，我们应该如何处理这两个线程？

第二幕：join()：等待你的归来

join()方法就像一个望夫石，主线程会一直等待子线程执行完毕，然后才会继续执行。调用join()后，主线程会被阻塞，直到子线程执行完worker_thread函数并返回。

#include <iostream>
#include <thread>
#include <chrono>

void worker_thread(int id) {
    std::cout << "Worker thread " << id << " started.n";
    std::this_thread::sleep_for(std::chrono::seconds(2));
    std::cout << "Worker thread " << id << " finished.n";
}

int main() {
    std::cout << "Main thread started.n";

    std::thread t1(worker_thread, 1);
    std::thread t2(worker_thread, 2);

    t1.join();
    t2.join();

    std::cout << "Main thread continues...n";
    std::cout << "Main thread finished.n";

    return 0;
}

运行结果大概如下：

Main thread started.
Worker thread 1 started.
Worker thread 2 started.
Worker thread 1 finished.
Worker thread 2 finished.
Main thread continues...
Main thread finished.

可以看到，主线程在t1.join()和t2.join()处被阻塞，直到两个子线程都执行完毕，才继续执行。

join()的适用场景：

需要子线程的执行结果： 当主线程需要子线程计算出的结果，或者子线程完成某些初始化工作后才能继续执行时，就应该使用join()。
确保资源清理： 如果子线程负责管理某些资源（例如文件句柄、网络连接），使用join()可以确保子线程在退出前释放这些资源，避免资源泄漏。
避免程序提前退出： 如果主线程退出，整个程序也会退出，而未完成的子线程会被强制终止。使用join()可以确保子线程在主线程退出前完成工作。

join()的注意事项：

只能调用一次： 一个std::thread对象只能调用一次join()。多次调用会导致程序崩溃。
必须是 joinable 的： 在调用join()之前，必须确保线程是 joinable 的。一个线程如果已经被join()或detach()过，或者线程对象是默认构造的（没有关联任何线程），那么它就不是 joinable 的。可以用t.joinable()来判断一个线程是否可以 join。
可能阻塞主线程： join()会阻塞主线程，如果子线程执行时间过长，会导致主线程响应缓慢。

第三幕：detach()：放飞自我

detach()方法则截然相反，它将子线程与std::thread对象分离。分离后，子线程会在后台继续运行，与主线程不再有任何关联。主线程不会等待子线程执行完毕，而是会继续执行自己的代码。

#include <iostream>
#include <thread>
#include <chrono>

void worker_thread(int id) {
    std::cout << "Worker thread " << id << " started.n";
    std::this_thread::sleep_for(std::chrono::seconds(2));
    std::cout << "Worker thread " << id << " finished.n";
}

int main() {
    std::cout << "Main thread started.n";

    std::thread t1(worker_thread, 1);
    std::thread t2(worker_thread, 2);

    t1.detach();
    t2.detach();

    std::cout << "Main thread continues...n";
    std::cout << "Main thread finished.n";

    std::this_thread::sleep_for(std::chrono::seconds(3)); // 确保子线程有时间执行完

    return 0;
}

运行结果可能如下（顺序可能不同，因为线程是并发执行的）：

Main thread started.
Worker thread 1 started.
Worker thread 2 started.
Main thread continues...
Main thread finished.
Worker thread 1 finished.
Worker thread 2 finished.

可以看到，主线程在调用t1.detach()和t2.detach()后，立即继续执行，没有等待子线程。为了确保子线程有足够的时间执行完毕，我们在main()函数结束前添加了一个sleep。

detach()的适用场景：

不需要子线程的结果： 当主线程不需要子线程的执行结果，子线程只是在后台执行一些辅助性任务（例如日志记录、定期备份）时，就可以使用detach()。
长时间运行的任务： 如果子线程执行时间很长，不希望阻塞主线程，可以使用detach()。
守护线程： 可以创建一些守护线程，在后台持续运行，提供某些服务。这些线程通常使用detach()。

detach()的注意事项：

资源管理问题： detach()后，子线程的生命周期与主线程无关。如果子线程持有某些资源，需要确保子线程在退出前正确释放这些资源，否则可能导致资源泄漏。这通常需要子线程自己管理自己的生命周期和资源。
数据竞争问题： 如果主线程和分离的子线程共享数据，需要格外小心数据竞争问题，使用互斥锁或其他同步机制来保护共享数据。
不能再次 join() 或 detach()： detach() 之后，线程对象不再与任何线程关联，不能再次调用 join() 或 detach()。
进程结束时可能被强制终止： 虽然线程被detach了，它仍然属于创建它的进程。当进程结束时，所有属于该进程的线程都会被强制终止，无论它们是否完成执行。因此，如果子线程需要执行一些重要的清理工作，需要确保在进程结束之前完成。

第四幕：joinable()：知己知彼

在调用join()或detach()之前，可以使用t.joinable()来判断线程是否可以 join 或 detach。如果线程对象没有关联任何线程，或者已经被 join() 或 detach() 过，那么 t.joinable() 会返回 false。

#include <iostream>
#include <thread>

void worker_thread() {
    std::cout << "Worker thread running.n";
}

int main() {
    std::thread t(worker_thread);

    if (t.joinable()) {
        std::cout << "Thread is joinable.n";
        t.join();
    } else {
        std::cout << "Thread is not joinable.n";
    }

    std::thread t2; // 默认构造，没有关联任何线程
    if (t2.joinable()) {
        std::cout << "Thread t2 is joinable.n";
    } else {
        std::cout << "Thread t2 is not joinable.n"; // 输出这个
    }

    return 0;
}

第五幕：选择的艺术：表格总结

特性	`join()`	`detach()`
主线程行为	阻塞，等待子线程完成	不阻塞，继续执行
子线程生命周期	受主线程控制，依赖于主线程的存在	独立于主线程，自主管理生命周期
资源管理	主线程负责资源管理，易于清理	子线程负责资源管理，需要小心资源泄漏
数据共享	相对容易，但仍需同步机制	更容易出现数据竞争，需要更严格的同步机制
适用场景	需要子线程结果、资源清理、避免提前退出	后台任务、长时间运行任务、守护线程
注意事项	只能调用一次，可能阻塞主线程，必须 joinable	资源管理责任转移，数据竞争风险，不能再次join或detach，进程结束时可能被强制终止

第六幕：代码示例：生产者-消费者模型

为了更好地理解join()和detach()的应用，我们来看一个经典的生产者-消费者模型。

#include <iostream>
#include <thread>
#include <queue>
#include <mutex>
#include <condition_variable>

std::queue<int> buffer;
std::mutex mtx;
std::condition_variable cv;
const int BUFFER_SIZE = 5;
bool production_complete = false;

void producer() {
    for (int i = 0; i < 10; ++i) {
        std::this_thread::sleep_for(std::chrono::milliseconds(100)); // 模拟生产过程
        std::unique_lock<std::mutex> lock(mtx);
        cv.wait(lock, []{ return buffer.size() < BUFFER_SIZE; }); // 等待缓冲区有空位

        buffer.push(i);
        std::cout << "Produced: " << i << std::endl;

        lock.unlock();
        cv.notify_one(); // 通知消费者
    }
    {
        std::lock_guard<std::mutex> lock(mtx);
        production_complete = true; // 标记生产完成
    }
    cv.notify_all(); // 通知所有消费者生产完成
}

void consumer(int id) {
    while (true) {
        std::unique_lock<std::mutex> lock(mtx);
        cv.wait(lock, []{ return !buffer.empty() || production_complete; }); // 等待缓冲区有数据或生产完成

        if (buffer.empty() && production_complete) {
            std::cout << "Consumer " << id << " exiting.n";
            return; // 生产完成且缓冲区为空，退出
        }

        int data = buffer.front();
        buffer.pop();
        std::cout << "Consumer " << id << " consumed: " << data << std::endl;

        lock.unlock();
        cv.notify_one(); // 通知生产者
        std::this_thread::sleep_for(std::chrono::milliseconds(200)); // 模拟消费过程
    }
}

int main() {
    std::thread producer_thread(producer);
    std::thread consumer_thread1(consumer, 1);
    std::thread consumer_thread2(consumer, 2);

    producer_thread.join(); // 等待生产者完成

    consumer_thread1.join(); // 等待消费者1完成
    consumer_thread2.join(); // 等待消费者2完成

    std::cout << "Main thread finished.n";

    return 0;
}

在这个例子中，我们使用join()来等待生产者和消费者线程完成。这是因为主线程需要确保所有数据都被生产和消费完毕，才能安全退出。如果使用detach()，可能会导致数据丢失或程序崩溃。

第七幕：进阶思考：RAII 与线程管理

为了更好地管理线程的生命周期，可以使用RAII（Resource Acquisition Is Initialization）技术。我们可以创建一个类，在构造函数中创建线程，在析构函数中根据情况选择join()或detach()。

#include <iostream>
#include <thread>

class ScopedThread {
public:
    template <typename Callable, typename... Args>
    ScopedThread(Callable&& func, Args&&... args)
        : t(std::forward<Callable>(func), std::forward<Args>(args)...)
        , detached_(false) {
    }

    ~ScopedThread() {
        if (t.joinable()) {
            std::cerr << "Warning: Thread is still running! Joining...n";
            t.join();
        }
    }

    void detach() {
        t.detach();
        detached_ = true;
    }

    std::thread& get() { return t; }
    const std::thread& get() const { return t; }

private:
    std::thread t;
    bool detached_;
};

void worker_thread() {
    std::cout << "Worker thread running.n";
    std::this_thread::sleep_for(std::chrono::seconds(1));
    std::cout << "Worker thread finished.n";
}

int main() {
    ScopedThread t(worker_thread);
    //t.detach(); // 如果需要detach，可以调用detach()
    std::cout << "Main thread finished.n";
    return 0;
}

这个ScopedThread类在构造函数中创建线程，在析构函数中判断线程是否还在运行。如果在析构时线程还在运行，就调用join()等待线程完成。这样可以确保线程在程序退出前被正确处理，避免资源泄漏。你可以选择在需要的时候调用 detach()来分离线程。

第八幕：总结与展望

join()和detach()是C++多线程编程中两个重要的工具，它们分别代表了不同的线程管理策略。选择哪个方法取决于具体的应用场景和需求。理解它们的区别和适用场景，可以帮助我们编写更健壮、更高效的多线程程序。

希望今天的讲座对大家有所帮助！记住，线程的世界充满了并发和挑战，但只要掌握了正确的工具和方法，就能驾驭它们，创造出更强大的程序！

感谢大家的收听！

发表回复 取消回复

发表回复取消回复