C++的协程库（Libco/Fibers）：实现用户态线程调度与上下文切换 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

C++协程库：用户态线程调度与上下文切换

大家好，今天我们来深入探讨C++中的协程库，特别是Libco和Fibers这类实现用户态线程调度和上下文切换的机制。在多线程编程中，操作系统内核负责线程的创建、调度和管理，这涉及到频繁的内核态/用户态切换，开销较大。协程则是一种用户态的线程，它允许我们在单个线程中并发执行多个任务，避免了内核态切换的开销，提高了并发性能。

1. 协程的本质：用户态的并发

协程，也称为轻量级线程或纤程，其核心思想是在用户空间模拟多线程并发。与操作系统线程不同，协程的调度和上下文切换完全由用户代码控制，不需要内核的参与。这意味着：

更低的开销： 避免了内核态/用户态切换，降低了上下文切换的成本。
更高的并发度： 可以在单个操作系统线程中运行大量的协程，提高并发处理能力。
更灵活的调度： 开发者可以根据应用场景自定义协程的调度策略。

2. 上下文切换：协程的核心机制

协程能够并发执行的关键在于上下文切换。上下文是指协程执行所需的所有状态信息，包括：

寄存器状态： CPU寄存器的值，如程序计数器(PC)、栈指针(SP)等。
栈：用于存储局部变量、函数调用信息等。
协程状态： 协程的执行状态，如就绪、运行、阻塞等。

上下文切换的过程就是将当前协程的上下文保存起来，然后恢复另一个协程的上下文。这样，CPU就可以在不同的协程之间快速切换，从而实现并发执行的效果。

3. Libco：腾讯开源的C++协程库

Libco是腾讯开源的一个C++协程库，它以简单、高效著称，广泛应用于微信后台等高性能服务中。Libco的核心是 coctx_t 结构体，它封装了协程的上下文信息。

3.1 coctx_t 结构体

struct coctx_t {
    void *regs[14]; // 寄存器状态
    char *stack_base; // 栈底
    size_t stack_size; // 栈大小
};

regs 数组用于保存CPU寄存器的值，stack_base 指向协程的栈底，stack_size 表示栈的大小。

3.2 协程的创建和切换

Libco提供了 coctx_make 函数用于创建协程，coctx_swap 函数用于切换协程。

*`coctx_make(coctx_t ctx, void func, const void arg):** 初始化协程上下文ctx，指定协程的入口函数func和参数arg。这个函数会分配协程的栈空间，并将func和arg设置到ctx` 中。
coctx_swap(coctx_t *from, coctx_t *to): 从协程 from 切换到协程 to。这个函数会将 from 的寄存器状态保存到 from->regs 中，然后将 to->regs 中的值恢复到CPU寄存器中，从而实现上下文切换。

3.3 Libco 代码示例：

#include <iostream>
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <stdint.h>

#ifdef __APPLE__
#include <sys/ucontext.h>
#else
#include <ucontext.h>
#endif

typedef void (*coRoutineFunc)(void *);

struct coctx_t {
    void *regs[14];
    char *stack_base;
    size_t stack_size;
};

void coctx_make(coctx_t *ctx, coRoutineFunc func, const void *arg);
void coctx_swap(coctx_t *from, coctx_t *to);

void coctx_make(coctx_t *ctx, coRoutineFunc func, const void *arg) {
    memset(ctx, 0, sizeof(coctx_t));

    void *sp = ctx->stack_base + ctx->stack_size - sizeof(void*);
    sp = (void*)((uintptr_t)sp & -16LL); // Align stack pointer to 16 bytes.

#ifdef __APPLE__
    ucontext_t uc;
    getcontext(&uc);

    uc.uc_stack.ss_sp = ctx->stack_base;
    uc.uc_stack.ss_size = ctx->stack_size;
    uc.uc_link = NULL;

    uc.uc_mcontext->__ss.__rip = (uintptr_t)func;
    uc.uc_mcontext->__ss.__rsp = (uintptr_t)sp;
    uc.uc_mcontext->__ss.__rdi = (uintptr_t)arg;

    makecontext(&uc, (void (*)(void))func, 1, arg);

    memcpy(ctx->regs, &uc, sizeof(ucontext_t));

#else
    uintptr_t *regs = (uintptr_t*)ctx->regs;
    regs[6] = (uintptr_t)sp; // rsp
    regs[7] = (uintptr_t)func; // rip
    regs[0] = (uintptr_t)arg; // rdi

    // Simulate a return to the entry point.
    // This is a crucial step that allows the coroutine to start correctly.
    regs[1] = (uintptr_t)func; // rsi - dummy value
    regs[2] = (uintptr_t)arg; // rdx - dummy value
    regs[3] = 0; // rcx - dummy value
    regs[4] = 0; // r8 - dummy value
    regs[5] = 0; // r9 - dummy value
#endif
}

void coctx_swap(coctx_t *from, coctx_t *to) {
#ifdef __APPLE__
    ucontext_t from_uc, to_uc;
    memcpy(&from_uc, from->regs, sizeof(ucontext_t));
    memcpy(&to_uc, to->regs, sizeof(ucontext_t));

    if (swapcontext(&from_uc, &to_uc) == -1) {
        perror("swapcontext");
        exit(1);
    }

    memcpy(from->regs, &from_uc, sizeof(ucontext_t));
    memcpy(to->regs, &to_uc, sizeof(ucontext_t));
#else
    asm volatile(
        "pushq %%rbpn"
        "pushq %%rbxn"
        "pushq %%r12n"
        "pushq %%r13n"
        "pushq %%r14n"
        "pushq %%r15n"
        "movq %%rsp, %0n"
        "movq %2, %%rspn"
        "popq %%r15n"
        "popq %%r14n"
        "popq %%r13n"
        "popq %%r12n"
        "popq %%rbxn"
        "popq %%rbpn"
        "retqn"
        : "=m"(from->regs[6]) // rsp
        : "m"(from->regs[6]), "m"(to->regs[6]), "D"(from), "S"(to)
        : "memory", "rsp", "rbp", "rbx", "r12", "r13", "r14", "r15"
    );
#endif
}

void coroutine_function(void *arg) {
    int id = *(int*)arg;
    for (int i = 0; i < 5; ++i) {
        std::cout << "Coroutine " << id << ": " << i << std::endl;
        sleep(1);
    }
}

int main() {
    coctx_t main_ctx;
    coctx_t coroutine1_ctx;
    coctx_t coroutine2_ctx;

    size_t stack_size = 1024 * 128; // 128KB stack
    char *coroutine1_stack = (char*)malloc(stack_size);
    char *coroutine2_stack = (char*)malloc(stack_size);

    if (!coroutine1_stack || !coroutine2_stack) {
        std::cerr << "Failed to allocate stack memory." << std::endl;
        return 1;
    }

    coroutine1_ctx.stack_base = coroutine1_stack;
    coroutine1_ctx.stack_size = stack_size;

    coroutine2_ctx.stack_base = coroutine2_stack;
    coroutine2_ctx.stack_size = stack_size;

    int id1 = 1;
    int id2 = 2;
    coctx_make(&coroutine1_ctx, coroutine_function, &id1);
    coctx_make(&coroutine2_ctx, coroutine_function, &id2);

    std::cout << "Starting coroutines..." << std::endl;

    for (int i = 0; i < 3; ++i) {
        std::cout << "Main function: " << i << std::endl;
        coctx_swap(&main_ctx, &coroutine1_ctx);
        std::cout << "Main function: back from coroutine 1: " << i << std::endl;
        coctx_swap(&main_ctx, &coroutine2_ctx);
        std::cout << "Main function: back from coroutine 2: " << i << std::endl;
        sleep(1);
    }

    std::cout << "Coroutines finished." << std::endl;

    free(coroutine1_stack);
    free(coroutine2_stack);

    return 0;
}

注意： 上述代码是一个简化的 Libco 示例，仅用于演示协程的创建和切换过程。实际的 Libco 库会更加复杂，包含更多的功能和优化。同时，该代码在macOS和Linux下都做了兼容，根据不同平台选择了不同的上下文切换方式。

4. Fibers：Windows下的协程实现

在Windows平台下，微软提供了Fibers API来实现协程。Fibers API提供了一组函数，用于创建、切换和管理Fiber。

4.1 Fiber API 简介

ConvertThreadToFiber(LPVOID lpParameter): 将当前线程转换为Fiber。
CreateFiber(SIZE_T dwStackSize, LPFIBER_START_ROUTINE lpStartAddress, LPVOID lpParameter): 创建一个新的Fiber。
SwitchToFiber(LPVOID lpFiber): 切换到指定的Fiber。
DeleteFiber(LPVOID lpFiber): 删除指定的Fiber。
GetFiberData(): 获取Fiber关联的数据。

4.2 Fiber 代码示例：

#include <iostream>
#include <Windows.h>

LPVOID Fiber1, Fiber2, MainFiber;

void FiberFunc(LPVOID lpParameter) {
    int id = *(int*)lpParameter;
    for (int i = 0; i < 5; ++i) {
        std::cout << "Fiber " << id << ": " << i << std::endl;
        Sleep(1000); // Simulate work
        SwitchToFiber(MainFiber);
    }
    std::cout << "Fiber " << id << " finished." << std::endl;
    DeleteFiber(GetCurrentFiber());
}

int main() {
    MainFiber = ConvertThreadToFiber(NULL);
    int id1 = 1, id2 = 2;

    Fiber1 = CreateFiber(0, FiberFunc, &id1);
    Fiber2 = CreateFiber(0, FiberFunc, &id2);

    std::cout << "Starting fibers..." << std::endl;

    for (int i = 0; i < 3; ++i) {
        std::cout << "Main function: " << i << std::endl;
        SwitchToFiber(Fiber1);
        std::cout << "Main function: back from Fiber 1: " << i << std::endl;
        SwitchToFiber(Fiber2);
        std::cout << "Main function: back from Fiber 2: " << i << std::endl;
        Sleep(1000);
    }

    std::cout << "Fibers finished." << std::endl;

    return 0;
}

5. 协程的调度策略：协作式 vs. 抢占式

协程的调度策略主要分为两种：

协作式调度（Cooperative Scheduling）： 协程主动让出CPU控制权，例如通过 yield 操作。 Libco 和 Windows Fibers 默认采用协作式调度。
抢占式调度（Preemptive Scheduling）： 调度器根据时间片或其他策略，强制切换协程。

特性	协作式调度	抢占式调度
调度方式	协程主动让出CPU	调度器强制切换协程
实现难度	较低	较高
优点	开销小，上下文切换更快	公平性更好，防止协程长时间占用CPU
缺点	容易出现协程长时间占用CPU导致其他协程饥饿	实现复杂，调度器开销较大

6. 协程的应用场景

协程在以下场景中具有广泛的应用：

I/O密集型应用： 协程可以有效地处理大量的I/O操作，提高并发性能。例如，网络服务器、数据库连接池等。
并发任务处理： 协程可以将一个复杂的任务分解成多个小的协程，并发执行，提高任务的处理速度。
游戏开发： 协程可以用于实现游戏中的AI、动画等功能，提高游戏的性能和响应速度。

7. 协程的优缺点

优点：

轻量级： 协程的创建和切换开销远小于线程。
高并发： 可以在单个线程中运行大量的协程，提高并发处理能力。
灵活性： 开发者可以自定义协程的调度策略。

缺点：

协作式调度需要协程主动让出CPU，如果协程长时间占用CPU，会导致其他协程饥饿。
调试难度较高，协程的执行流程比较复杂，难以追踪和调试。
不适合CPU密集型应用，协程无法利用多核CPU的优势。

8. 现代 C++ 协程 (C++20)

C++20 引入了标准协程支持，通过 co_await, co_yield, 和 co_return 关键字，提供了更简洁和类型安全的协程编程模型。标准协程构建在底层promise对象和coroutine handle之上，编译器会自动生成状态机代码来管理协程的生命周期和上下文切换。

现代 C++ 协程示例

#include <iostream>
#include <coroutine>

struct ReturnObject {
    struct promise_type {
        ReturnObject get_return_object() { return {}; }
        std::suspend_never initial_suspend() { return {}; }
        std::suspend_never final_suspend() noexcept { return {}; }
        void unhandled_exception() {}
        void return_void() {}
    };
};

ReturnObject MyCoroutine() {
    std::cout << "Coroutine started" << std::endl;
    co_await std::suspend_always{};
    std::cout << "Coroutine resumed" << std::endl;
    co_return;
}

int main() {
    auto coro = MyCoroutine();
    std::cout << "Main function" << std::endl;
    return 0;
}

9. Libco、Fibers与C++20协程的比较

特性	Libco/Fibers	C++20 协程
标准化程度	非标准库，需要引入第三方库	C++ 标准库的一部分
语法	需要手动管理上下文和栈	使用 `co_await`, `co_yield`, `co_return` 关键字
类型安全	较低，容易出现类型错误	较高，编译器进行类型检查
性能	经过优化，性能较高	性能良好，但可能略低于手动实现的协程
易用性	相对复杂，需要理解底层机制	更简洁，更易于使用
跨平台性	Libco跨平台性较好，Fibers仅限于Windows平台	理论上跨平台，但编译器支持程度不同

选择建议：

如果需要极致的性能，并且对底层机制有深入的了解，可以选择Libco/Fibers。
如果追求代码的简洁性和类型安全，并且希望使用标准的C++特性，可以选择C++20协程。
对于Windows平台，Fibers是一个不错的选择，可以方便地利用Windows API。

总结一下

协程作为一种用户态的并发机制，具有轻量级、高并发、灵活性的优点，在I/O密集型应用、并发任务处理、游戏开发等领域具有广泛的应用。选择合适的协程库取决于具体的应用场景和需求。现代C++协程提供了标准化的协程编程模型，简化了协程的使用，提高了代码的可读性和可维护性。

更多IT精英技术系列讲座，到智猿学院

C++协程库：用户态线程调度与上下文切换

发表回复 取消回复

发表回复取消回复