利用协程构建 ‘Asynchronous I/O’ 框架：对比 `io_uring` 与 C++ 协程的深度集成方案 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

各位同仁、技术爱好者，大家好！

今天，我们将深入探讨一个在现代高性能系统编程中至关重要的主题：如何利用C++协程与Linux内核的io_uring机制，构建一个高效、优雅的异步I/O框架。这将是一场关于性能、抽象与系统深层原理的旅程，旨在揭示这两种技术结合所能释放的巨大潜力。

I. 异步I/O的必然选择与传统困境

在当今数据密集型和高并发的应用场景中，I/O操作（如文件读写、网络通信）往往是性能瓶颈。传统的同步I/O模型会阻塞当前线程，直到I/O完成，这在处理大量并发请求时效率低下。为了解决这个问题，异步I/O应运而生。

A. 为什么需要异步I/O？

想象一个Web服务器，它需要同时处理成千上万个客户端连接。如果每个连接都使用一个独立的线程，那么线程上下文切换的开销、内存消耗以及线程池的限制将很快成为瓶颈。而如果使用同步I/O，一个连接的I/O阻塞将导致整个线程停滞，无法服务其他客户端。异步I/O允许程序发起I/O操作后立即返回，继续执行其他任务，待I/O完成时再通过某种机制通知程序。这种“不阻塞”的特性，是构建高吞吐量、低延迟系统的基石。

B. 传统异步I/O方案的局限性

在C++领域，实现异步I/O的方式多种多样，但它们各自存在一些挑战：

回调函数（Callbacks）：
- 优点：简单直接，能实现非阻塞。
- 缺点：易导致“回调地狱”（Callback Hell），代码逻辑分散、难以理解和维护，错误处理复杂。
多线程（Threads）：
- 优点：并发能力强，编程模型相对直观（每个线程执行同步I/O）。
- 缺点：线程创建、销毁、上下文切换开销大；线程数量受限；共享数据需要复杂的同步机制（锁、原子操作），易引入死锁和竞态条件。
Future/Promise模式：
- 优点：提供了更结构化的异步结果获取方式，避免了回调地狱。
- 缺点：底层仍需依赖线程池或事件循环来执行异步操作，并不能直接解决I/O本身的非阻塞问题。通常结合std::async或std::packaged_task使用，但这些在底层仍然可能是阻塞I/O + 线程。
基于事件循环的多路复用（select/poll/epoll）：
- 优点：一个线程可以管理大量I/O事件，避免了线程开销。
- 缺点：编程模型复杂，需要手动管理文件描述符状态，I/O操作本身（read/write）仍然可能是阻塞的，需要将数据读写操作拆分成多个小块，或者使用非阻塞模式。逻辑流在事件处理函数之间跳跃，可读性不佳。

这些传统方案要么在编程模型上不够优雅，要么在性能上存在瓶颈，尤其是在与操作系统内核交互时，多次系统调用和上下文切换的开销无法避免。

C. 协程：异步编程的新范式

C++20引入的协程（Coroutines）为异步编程带来了革命性的变革。它允许我们以同步的、顺序的编程风格来编写异步代码。协程是一种可以在执行过程中暂停（suspend）和恢复（resume）的函数。当一个协程遇到一个等待异步操作完成的指令时，它可以暂停自己，将控制权交还给调用者或调度器，而不会阻塞整个线程。一旦异步操作完成，调度器可以恢复该协程的执行，仿佛它从未中断过一样。

这种机制彻底改变了异步代码的可读性和可维护性，使得复杂的异步逻辑变得像同步代码一样直观。

II. C++协程：语言级的异步抽象

C++协程的核心在于其强大的语言特性，它通过几个关键字和概念，将异步编程的复杂性封装起来。

A. C++协程核心概念

co_await: 用于暂停当前协程，等待一个“可等待对象”（awaitable object）完成。当co_await表达式被求值时，如果可等待对象尚未准备好结果，协程将挂起，控制权返回给调用者。一旦可等待对象完成，协程将从挂起点恢复。
co_yield: 用于在生成器（generator）协程中产生一个值，并暂停协程，等待下次请求值时恢复。
co_return: 用于从协程中返回一个值，并结束协程的执行。
awaitable: 任何定义了operator co_await()或直接实现awaiter接口的对象。它是协程暂停和恢复的机制。
awaiter: co_await操作符背后的真正逻辑。一个awaiter对象必须实现三个方法：
- bool await_ready(): 检查异步操作是否已经完成。如果为true，协程不挂起，直接执行await_resume()。
- void await_suspend(std::coroutine_handle<P> handle): 异步操作未完成时，协程挂起，此方法被调用。handle是当前协程的句柄，可用于恢复协程。此方法负责注册回调或事件，以便在异步操作完成后恢复协程。
- T await_resume(): 异步操作完成后，协程恢复时，此方法被调用。它返回异步操作的结果或抛出异常。

B. 协程如何实现异步编程

协程本身并不提供异步I/O的能力，它只是提供了一种语言机制，让异步操作的API更容易被消费。真正的异步能力仍然需要底层I/O机制（如epoll、io_uring）来提供。协程的作用在于，它将这些底层机制的复杂性隐藏在一个“可等待对象”之后，使得上层应用代码能够以看似同步的方式编写异步逻辑。

C. 构建一个基本的协程执行器/调度器

一个完整的协程框架需要一个调度器来管理协程的生命周期和执行。这里我们先定义一个通用的Task类型，它是一个可等待对象，代表一个异步操作的结果。

#include <coroutine>
#include <iostream>
#include <thread>
#include <chrono>
#include <deque>
#include <mutex>
#include <condition_variable>
#include <functional>

// 1. Task<T> - 协程的返回类型，代表一个异步操作的结果
template<typename T>
struct Task {
    struct promise_type;
    using handle_type = std::coroutine_handle<promise_type>;

    handle_type handle;
    std::mutex mtx;
    std::condition_variable cv;
    bool ready = false; // 结果是否就绪
    T result;
    std::exception_ptr exception;

    Task(handle_type h) : handle(h) {}
    ~Task() {
        if (handle) handle.destroy();
    }

    // 不允许拷贝，只允许移动
    Task(const Task&) = delete;
    Task& operator=(const Task&) = delete;
    Task(Task&& other) noexcept : handle(other.handle) {
        other.handle = nullptr;
    }
    Task& operator=(Task&& other) noexcept {
        if (this != &other) {
            if (handle) handle.destroy();
            handle = other.handle;
            other.handle = nullptr;
        }
        return *this;
    }

    // Awaiter接口
    struct TaskAwaiter {
        Task& task;
        TaskAwaiter(Task& t) : task(t) {}

        bool await_ready() {
            std::lock_guard<std::mutex> lock(task.mtx);
            return task.ready; // 如果结果已经就绪，无需挂起
        }

        void await_suspend(std::coroutine_handle<> caller_handle) {
            // 当Task挂起时，将调用者协程的句柄保存起来，以便结果就绪时恢复
            task.handle.promise().caller_handle = caller_handle;
            // 注意：这里我们假设Task的promise_type会负责在结果就绪时恢复caller_handle
            // 对于我们的简单实现，我们会直接在get()中等待结果
        }

        T await_resume() {
            std::lock_guard<std::mutex> lock(task.mtx);
            if (task.exception) {
                std::rethrow_exception(task.exception);
            }
            return task.result;
        }
    };

    TaskAwaiter operator co_await() {
        return TaskAwaiter(*this);
    }

    // 阻塞获取结果，通常在主线程或调度器中调用
    T get() {
        std::unique_lock<std::mutex> lock(mtx);
        cv.wait(lock, [this]{ return ready; });
        if (exception) {
            std::rethrow_exception(exception);
        }
        return result;
    }

    struct promise_type {
        Task get_return_object() {
            return Task(handle_type::from_promise(*this));
        }
        std::suspend_always initial_suspend() { return {}; } // 协程立即挂起，等待调度
        std::suspend_always final_suspend() noexcept { return {}; } // 协程结束时挂起，等待被销毁

        void return_value(T value) {
            std::lock_guard<std::mutex> lock(self_task->mtx);
            self_task->result = value;
            self_task->ready = true;
            self_task->cv.notify_one();
            if (caller_handle) caller_handle.resume(); // 如果有调用者，恢复它
        }

        void unhandled_exception() {
            std::lock_guard<std::mutex> lock(self_task->mtx);
            self_task->exception = std::current_exception();
            self_task->ready = true;
            self_task->cv.notify_one();
            if (caller_handle) caller_handle.resume(); // 如果有调用者，恢复它
        }

        // 用于保存 Task 实例的指针，方便在 promise_type 中访问
        Task* self_task = nullptr;
        // 用于保存调用者协程的句柄，以便在当前协程完成时恢复调用者
        std::coroutine_handle<> caller_handle;

        promise_type() {
            // 在构造promise_type时，将自身与Task关联
            // 注意：这里需要一个巧妙的设计来获取Task的指针
            // 更常见的做法是在get_return_object()中设置
        }
    };
};

// 辅助函数，用于将 promise_type 和 Task 关联
template<typename T>
struct Task<T>::promise_type {
    // ... 其他成员 ...
    Task<T> get_return_object() {
        Task<T> task{handle_type::from_promise(*this)};
        self_task = &task; // 在这里关联
        return task;
    }
    // ... 其他成员 ...
};

// 简单的调度器，管理协程的执行
class CoroutineScheduler {
public:
    void schedule(std::coroutine_handle<> handle) {
        std::lock_guard<std::mutex> lock(mtx_);
        runnable_tasks_.push_back(handle);
        cv_.notify_one();
    }

    void run_one() {
        std::unique_lock<std::mutex> lock(mtx_);
        cv_.wait(lock, [this]{ return !runnable_tasks_.empty() || !running_; });
        if (!runnable_tasks_.empty()) {
            std::coroutine_handle<> handle = runnable_tasks_.front();
            runnable_tasks_.pop_front();
            lock.unlock(); // 在恢复协程前释放锁，避免死锁
            handle.resume();
        }
    }

    void run() {
        running_ = true;
        while (running_) {
            run_one();
        }
    }

    void stop() {
        running_ = false;
        cv_.notify_one(); // 唤醒等待的线程，使其退出
    }

private:
    std::deque<std::coroutine_handle<>> runnable_tasks_;
    std::mutex mtx_;
    std::condition_variable cv_;
    bool running_ = false;
};

// 全局调度器实例
CoroutineScheduler g_scheduler;

// 模拟异步操作
struct AsyncSleep {
    std::chrono::milliseconds duration;
    bool await_ready() { return false; } // 总是挂起
    void await_suspend(std::coroutine_handle<> handle) {
        // 在新线程中模拟延时，完成后恢复协程
        std::thread([handle, dur = duration]() mutable {
            std::this_thread::sleep_for(dur);
            g_scheduler.schedule(handle); // 将协程重新放入调度器队列
        }).detach(); // 分离线程，让它独立运行
    }
    void await_resume() {}
};

// 协程函数示例
Task<int> do_something_async(int id) {
    std::cout << "Coroutine " << id << ": Starting..." << std::endl;
    co_await AsyncSleep{std::chrono::seconds(2)}; // 模拟2秒异步操作
    std::cout << "Coroutine " << id << ": After 2s sleep." << std::endl;
    co_await AsyncSleep{std::chrono::seconds(1)}; // 模拟1秒异步操作
    std::cout << "Coroutine " << id << ": After 1s sleep." << std::endl;
    co_return id * 10;
}

// 主函数
int main() {
    std::cout << "Main: Starting async tasks." << std::endl;

    auto t1 = do_something_async(1);
    auto t2 = do_something_async(2);

    // 启动调度器线程
    std::thread scheduler_thread([&](){ g_scheduler.run(); });

    // 等待协程结果
    std::cout << "Main: Task 1 result: " << t1.get() << std::endl;
    std::cout << "Main: Task 2 result: " << t2.get() << std::endl;

    g_scheduler.stop();
    scheduler_thread.join();

    std::cout << "Main: All tasks completed." << std::endl;
    return 0;
}

代码解析：

Task<T>: 这是我们的核心可等待类型，它封装了一个协程的返回结果。promise_type负责协程的生命周期管理、结果存储和异常处理。TaskAwaiter是Task的co_await实现。
CoroutineScheduler: 一个简单的单线程调度器，维护一个可运行协程的队列。schedule方法将协程句柄加入队列，run方法循环从队列中取出协程并恢复执行。
AsyncSleep: 这是一个自定义的可等待对象，模拟一个异步延时操作。它在await_suspend中启动一个新线程来等待，并在延时结束后通过调度器恢复原来的协程。这展示了协程如何与线程集成。
do_something_async: 这是一个协程函数，它使用co_await AsyncSleep{...}来模拟异步操作。它的代码逻辑看起来是同步的，但实际执行是异步的。
main函数: 创建两个Task，启动调度器线程，然后阻塞等待Task的结果。

这个例子虽然使用了线程来模拟异步，但它清晰地展示了C++协程的编程模型：用同步的语法表达异步的逻辑。然而，真正的异步I/O还需要更底层的支持，这就是io_uring的用武之地。

III. `io_uring`：内核级的异步I/O引擎

io_uring是Linux内核在5.1版本引入的一种高性能异步I/O接口，旨在解决传统异步I/O（如aio、epoll）的局限性，提供真正意义上的、零拷贝的异步I/O能力。

A. io_uring设计原理

io_uring的核心是一个高效的用户空间与内核空间共享的环形缓冲区（ring buffer）机制。它由两个主要环组成：

提交队列（Submission Queue, SQ）：用户空间向SQ提交I/O请求（Submission Queue Entry, SQE）。SQ是生产者-消费者模型，用户空间是生产者，内核是消费者。
完成队列（Completion Queue, CQ）：内核向CQ报告I/O操作的完成情况（Completion Queue Entry, CQE）。CQ也是生产者-消费者模型，内核是生产者，用户空间是消费者。

这两个环形缓冲区通常通过mmap映射到用户空间，从而避免了每次I/O操作都需要进行系统调用和数据拷贝。

B. io_uring的优势

单系统调用提交多个请求：用户可以在SQ中批量提交多个SQE，然后通过一次io_uring_enter系统调用将它们全部提交给内核。这大大减少了系统调用开销。
减少上下文切换：大部分情况下，io_uring可以在内核中直接处理I/O请求，无需频繁地在用户态和内核态之间切换。
真正的异步I/O：不像epoll只通知I/O事件准备就绪，io_uring允许你提交完整的I/O操作（如read、write），并在操作完成后直接获取结果，无需再次系统调用。
广泛的操作支持：除了传统的文件和网络I/O，io_uring还支持定时器、accept、splice、sendmsg、recvmsg等多种操作，甚至包括一些非I/O操作，如openat、statx。

C. io_uring基本操作

使用io_uring的一般流程：

io_uring_setup()：创建一个io_uring实例，返回一个文件描述符。
io_uring_get_sqe()：从SQ中获取一个空的SQE。
填充SQE：设置SQE的操作类型（IORING_OP_READ等）、文件描述符、缓冲区、偏移量、长度等参数。一个重要的字段是user_data，它是一个64位的值，可以用来关联用户空间的数据（例如协程句柄）。
io_uring_submit()：将填充好的SQE提交给内核。
io_uring_wait_cqe()：等待CQE的到来，即等待I/O操作完成。可以阻塞等待，也可以超时等待，或者轮询。
处理CQE：从CQ中获取完成的CQE，通过user_data字段找到对应的用户空间上下文，并处理操作结果（成功、失败、返回数据）。
io_uring_cqe_seen()：标记CQE已被处理。
io_uring_queue_exit()：关闭io_uring实例。

D. 基本io_uring读操作示例

为了专注于io_uring本身，我们暂时不与协程集成。

#include <liburing.h> // 需要安装liburing开发库
#include <fcntl.h>
#include <unistd.h>
#include <iostream>
#include <vector>
#include <string>

// 宏定义，用于检查系统调用错误
#define CHECK(ret, msg) 
    if (ret < 0) { 
        perror(msg); 
        exit(EXIT_FAILURE); 
    }

int main() {
    struct io_uring ring;
    int ret;

    // 1. 初始化io_uring，队列深度为8
    ret = io_uring_queue_init(8, &ring, 0);
    CHECK(ret, "io_uring_queue_init");

    // 2. 创建一个测试文件
    const char* filename = "test_file.txt";
    const char* content = "Hello, io_uring asynchronous I/O!";
    int fd = open(filename, O_CREAT | O_WRONLY | O_TRUNC, 0644);
    CHECK(fd, "open write");
    ssize_t bytes_written = write(fd, content, strlen(content));
    CHECK(bytes_written, "write content");
    close(fd);

    // 重新打开文件进行读取
    fd = open(filename, O_RDONLY);
    CHECK(fd, "open read");

    // 3. 准备缓冲区
    std::vector<char> buffer(1024); // 1KB缓冲区

    // 4. 获取一个提交队列条目 (SQE)
    struct io_uring_sqe *sqe = io_uring_get_sqe(&ring);
    if (!sqe) {
        std::cerr << "Failed to get SQE" << std::endl;
        io_uring_queue_exit(&ring);
        close(fd);
        return 1;
    }

    // 5. 填充SQE，设置读取操作
    io_uring_prep_read(sqe, fd, buffer.data(), buffer.size(), 0);
    // user_data 可以用来关联用户自定义数据，这里我们简单设为123
    sqe->user_data = 123; 

    // 6. 提交SQE到内核
    ret = io_uring_submit(&ring);
    CHECK(ret, "io_uring_submit");
    std::cout << "Submitted 1 read request." << std::endl;

    // 7. 等待完成队列条目 (CQE)
    struct io_uring_cqe *cqe;
    ret = io_uring_wait_cqe(&ring, &cqe);
    CHECK(ret, "io_uring_wait_cqe");

    // 8. 处理CQE
    if (cqe->res < 0) {
        std::cerr << "I/O error: " << strerror(-cqe->res) << std::endl;
    } else {
        std::cout << "Read completed. User data: " << cqe->user_data 
                  << ", Bytes read: " << cqe->res << std::endl;
        std::cout << "Content: " << std::string(buffer.data(), cqe->res) << std::endl;
    }

    // 9. 标记CQE为已处理
    io_uring_cqe_seen(&ring, cqe);

    // 10. 清理资源
    io_uring_queue_exit(&ring);
    close(fd);
    unlink(filename); // 删除测试文件

    return 0;
}

代码解析：

io_uring_queue_init: 初始化io_uring实例。
io_uring_prep_read: 是liburing库提供的一个方便函数，用于预填充一个read操作的SQE。
sqe->user_data: 这是关键，它可以携带用户定义的数据，在CQE中原样返回，用于识别是哪个请求完成了。
io_uring_submit: 提交请求到内核。
io_uring_wait_cqe: 阻塞等待一个完成事件。
cqe->res: 包含了I/O操作的结果（成功时为读取的字节数，失败时为负的错误码）。
io_uring_cqe_seen: 必须调用，告知内核这个CQE已经被消费。

这个例子展示了io_uring的低级API。虽然高效，但直接使用仍然是命令式的、基于事件循环的。将其与C++协程结合，才能实现既高效又优雅的编程模型。

IV. 深度集成：`io_uring`与C++协程

现在，我们将把io_uring的强大内核能力与C++协程的优雅编程模型结合起来，构建一个真正的异步I/O框架。

A. io_uring与C++协程的协同效应

io_uring提供极致的性能：通过减少系统调用和上下文切换，实现高效的I/O。
C++协程提供高级抽象：将复杂的io_uring事件循环和回调机制封装成易于理解和使用的co_await表达式。

两者的结合，使得我们能够以同步代码的简洁性来编写高性能的异步I/O程序。

B. 设计一个io_uring支持的协程Awaiter

核心思想是：

io_uring_context (或 UringScheduler)：一个单例或全局对象，负责管理io_uring实例，并运行其事件循环。它负责提交SQE，并从CQ中获取CQE，然后根据user_data恢复相应的协程。
UringAwaiter (或类似)：一个自定义的可等待对象，它封装了一个特定的io_uring操作（如read、write）。
await_suspend方法：当协程co_await一个UringAwaiter时，await_suspend会被调用。在这个方法中，我们将：
- 从io_uring_context获取一个SQE。
- 填充SQE的详细信息（文件描述符、缓冲区、长度等）。
- 将当前协程的std::coroutine_handle作为user_data存储到SQE中，或者存储一个能唯一识别该协程的ID。
- 将SQE提交给io_uring_context的提交队列。
- 返回true，表示协程需要挂起。
io_uring_context的事件循环：不断地轮询或阻塞等待io_uring的CQE。当一个CQE到来时：
- 从CQE中取出user_data。
- 将user_data（协程句柄）重新放入UringScheduler的可运行队列。
await_resume方法：当协程被恢复时，await_resume会被调用。它会检查I/O操作的结果（成功或失败），并返回相应的数据。

C. async_read操作的逐步实现

我们将构建一个简化版的框架，用于演示io_uring与协程的集成。

#include <liburing.h>
#include <fcntl.h>
#include <unistd.h>
#include <iostream>
#include <vector>
#include <string>
#include <coroutine>
#include <thread>
#include <deque>
#include <mutex>
#include <condition_variable>
#include <map>
#include <stdexcept>

// 辅助宏
#define CHECK_RET(ret, msg) 
    if (ret < 0) { 
        throw std::runtime_error(std::string(msg) + ": " + strerror(-ret)); 
    }

// 前向声明
template<typename T> struct UringTask;
class UringScheduler;

// 全局调度器实例
UringScheduler g_uring_scheduler;

// 1. UringTask<T> - 协程的返回类型，与之前的Task类似，但针对io_uring环境
template<typename T>
struct UringTask {
    struct promise_type;
    using handle_type = std::coroutine_handle<promise_type>;

    handle_type handle;
    std::mutex mtx;
    std::condition_variable cv;
    bool ready = false;
    T result;
    std::exception_ptr exception;

    UringTask(handle_type h) : handle(h) {}
    ~UringTask() {
        if (handle) handle.destroy();
    }
    UringTask(const UringTask&) = delete;
    UringTask& operator=(const UringTask&) = delete;
    UringTask(UringTask&& other) noexcept : handle(other.handle) {
        other.handle = nullptr;
    }
    UringTask& operator=(UringTask&& other) noexcept {
        if (this != &other) {
            if (handle) handle.destroy();
            handle = other.handle;
            other.handle = nullptr;
        }
        return *this;
    }

    struct UringTaskAwaiter {
        UringTask& task;
        UringTaskAwaiter(UringTask& t) : task(t) {}

        bool await_ready() {
            std::lock_guard<std::mutex> lock(task.mtx);
            return task.ready;
        }

        void await_suspend(std::coroutine_handle<> caller_handle) {
            task.handle.promise().caller_handle = caller_handle;
            // 如果Task内部的协程尚未开始执行，或者在等待其他事件，那么这里就等待
            // 这里我们假设Task的promise_type会负责恢复caller_handle
        }

        T await_resume() {
            std::lock_guard<std::mutex> lock(task.mtx);
            if (task.exception) {
                std::rethrow_exception(task.exception);
            }
            return task.result;
        }
    };

    UringTaskAwaiter operator co_await() {
        return UringTaskAwaiter(*this);
    }

    T get() {
        std::unique_lock<std::mutex> lock(mtx);
        cv.wait(lock, [this]{ return ready; });
        if (exception) {
            std::rethrow_exception(exception);
        }
        return result;
    }

    struct promise_type {
        UringTask get_return_object() {
            UringTask task{handle_type::from_promise(*this)};
            self_task = &task;
            return task;
        }
        std::suspend_always initial_suspend() { return {}; } // 协程立即挂起，等待调度
        std::suspend_always final_suspend() noexcept { return {}; } // 协程结束时挂起

        void return_value(T value) {
            std::lock_guard<std::mutex> lock(self_task->mtx);
            self_task->result = value;
            self_task->ready = true;
            self_task->cv.notify_one();
            if (caller_handle) {
                g_uring_scheduler.schedule(caller_handle); // 恢复调用者协程
            }
        }

        void unhandled_exception() {
            std::lock_guard<std::mutex> lock(self_task->mtx);
            self_task->exception = std::current_exception();
            self_task->ready = true;
            self_task->cv.notify_one();
            if (caller_handle) {
                g_uring_scheduler.schedule(caller_handle);
            }
        }

        UringTask* self_task = nullptr;
        std::coroutine_handle<> caller_handle;
    };
};

// 2. UringScheduler - 管理io_uring实例和协程调度
class UringScheduler {
public:
    UringScheduler(unsigned int entries = 1024) : ring_entries_(entries), running_(false) {
        int ret = io_uring_queue_init(ring_entries_, &ring_, 0);
        CHECK_RET(ret, "io_uring_queue_init");
        std::cout << "io_uring initialized with " << entries << " entries." << std::endl;
    }

    ~UringScheduler() {
        if (running_) {
            stop();
            if (worker_thread_.joinable()) {
                worker_thread_.join();
            }
        }
        io_uring_queue_exit(&ring_);
    }

    // 不允许拷贝和移动
    UringScheduler(const UringScheduler&) = delete;
    UringScheduler& operator=(const UringScheduler&) = delete;
    UringScheduler(UringScheduler&&) = delete;
    UringScheduler& operator=(UringScheduler&&) = delete;

    // 提交一个SQE
    void submit_sqe(struct io_uring_sqe* sqe) {
        std::lock_guard<std::mutex> lock(sqe_mtx_);
        // 确保 sqe 已经通过 io_uring_get_sqe 获取，并填充了 user_data
        int ret = io_uring_submit(&ring_);
        if (ret < 0) {
            throw std::runtime_error(std::string("io_uring_submit failed: ") + strerror(-ret));
        }
    }

    // 调度一个协程句柄，使其在下一次事件循环中运行
    void schedule(std::coroutine_handle<> handle) {
        std::lock_guard<std::mutex> lock(runnable_tasks_mtx_);
        runnable_tasks_.push_back(handle);
        runnable_cv_.notify_one();
    }

    // 启动调度器的主循环
    void run() {
        running_ = true;
        worker_thread_ = std::thread([this]() {
            event_loop();
        });
    }

    void stop() {
        running_ = false;
        runnable_cv_.notify_one(); // 唤醒可能的等待者
        // 还需要一种方式唤醒io_uring_wait_cqe，可以通过提交一个noop操作
        struct io_uring_sqe *sqe = io_uring_get_sqe(&ring_);
        if (sqe) {
            io_uring_prep_nop(sqe);
            sqe->user_data = reinterpret_cast<uint64_t>(nullptr); // 标记这是一个停止信号
            io_uring_submit(&ring_);
        }
        if (worker_thread_.joinable()) {
            worker_thread_.join();
        }
    }

private:
    struct io_uring ring_;
    unsigned int ring_entries_;
    bool running_;
    std::thread worker_thread_;

    std::deque<std::coroutine_handle<>> runnable_tasks_;
    std::mutex runnable_tasks_mtx_;
    std::condition_variable runnable_cv_;

    std::mutex sqe_mtx_; // 保护io_uring_submit的并发访问

    // io_uring事件循环
    void event_loop() {
        while (running_) {
            // 优先处理可运行的协程
            std::unique_lock<std::mutex> lock(runnable_tasks_mtx_);
            if (!runnable_tasks_.empty()) {
                std::coroutine_handle<> handle = runnable_tasks_.front();
                runnable_tasks_.pop_front();
                lock.unlock(); // 在恢复协程前释放锁
                handle.resume();
                continue; // 重新检查是否有更多可运行协程
            }
            lock.unlock();

            // 如果没有可运行协程，则等待io_uring事件
            struct io_uring_cqe *cqe;
            // 使用 io_uring_wait_cqe 阻塞等待，或者 io_uring_peek_cqe 进行轮询
            // 这里我们使用阻塞等待，并设置一个短超时，以便能检查running_状态和runnable_tasks_
            // 实际生产环境中可能需要更复杂的逻辑，例如使用io_uring_enter带超时
            int ret = io_uring_wait_cqe(&ring_, &cqe);
            if (ret == -EINTR) { // 被信号中断
                continue;
            }
            if (ret < 0) {
                std::cerr << "io_uring_wait_cqe failed: " << strerror(-ret) << std::endl;
                // 考虑如何处理错误，可能需要停止调度器
                break;
            }

            // 检查是否是停止信号
            if (cqe->user_data == reinterpret_cast<uint64_t>(nullptr)) {
                io_uring_cqe_seen(&ring_, cqe);
                std::cout << "Scheduler received stop signal." << std::endl;
                break; // 退出循环
            }

            // 处理完成的I/O事件
            std::coroutine_handle<> handle = reinterpret_cast<std::coroutine_handle<>>(cqe->user_data);
            if (handle) {
                // 将协程重新调度到可运行队列
                schedule(handle);
            }
            io_uring_cqe_seen(&ring_, cqe);
        }
        std::cout << "UringScheduler event loop stopped." << std::endl;
    }
};

// 3. UringReadAwaiter - 封装io_uring read操作的可等待对象
struct UringReadAwaiter {
    int fd;
    void* buffer;
    size_t length;
    off_t offset;
    ssize_t result_bytes_read; // 存储读取结果
    int error_code;            // 存储错误码

    UringReadAwaiter(int file_descriptor, void* buf, size_t len, off_t off)
        : fd(file_descriptor), buffer(buf), length(len), offset(off),
          result_bytes_read(0), error_code(0) {}

    bool await_ready() { return false; } // 总是挂起，等待io_uring完成

    void await_suspend(std::coroutine_handle<> handle) {
        // 从io_uring获取一个SQE
        struct io_uring_sqe *sqe = io_uring_get_sqe(&g_uring_scheduler.ring_); // 直接访问ring_，需要UringScheduler提供访问接口

        if (!sqe) {
            // 如果无法获取SQE，需要处理错误，这里简单抛出异常
            // 实际情况可能需要将协程恢复，并传递错误
            throw std::runtime_error("Failed to get io_uring SQE.");
        }

        // 填充read操作的SQE
        io_uring_prep_read(sqe, fd, buffer, length, offset);
        // 将当前协程的句柄作为user_data，以便完成后恢复
        sqe->user_data = reinterpret_cast<uint64_t>(handle.address());

        // 提交SQE到io_uring
        g_uring_scheduler.submit_sqe(sqe);
    }

    ssize_t await_resume() {
        if (error_code != 0) {
            throw std::runtime_error(std::string("Async read error: ") + strerror(error_code));
        }
        return result_bytes_read;
    }
};

// 4. UringWriteAwaiter - 封装io_uring write操作的可等待对象
struct UringWriteAwaiter {
    int fd;
    const void* buffer;
    size_t length;
    off_t offset;
    ssize_t result_bytes_written;
    int error_code;

    UringWriteAwaiter(int file_descriptor, const void* buf, size_t len, off_t off)
        : fd(file_descriptor), buffer(buf), length(len), offset(off),
          result_bytes_written(0), error_code(0) {}

    bool await_ready() { return false; }

    void await_suspend(std::coroutine_handle<> handle) {
        struct io_uring_sqe *sqe = io_uring_get_sqe(&g_uring_scheduler.ring_);
        if (!sqe) {
            throw std::runtime_error("Failed to get io_uring SQE for write.");
        }

        io_uring_prep_write(sqe, fd, buffer, length, offset);
        sqe->user_data = reinterpret_cast<uint64_t>(handle.address());
        g_uring_scheduler.submit_sqe(sqe);
    }

    ssize_t await_resume() {
        if (error_code != 0) {
            throw std::runtime_error(std::string("Async write error: ") + strerror(error_code));
        }
        return result_bytes_written;
    }
};

// 5. 协程函数示例：使用async_read和async_write
UringTask<std::string> async_file_io(const std::string& filename) {
    std::cout << "Async file IO: Opening file " << filename << std::endl;
    int fd = open(filename.c_str(), O_RDWR | O_CREAT, 0644);
    if (fd < 0) {
        throw std::runtime_error(std::string("Failed to open file: ") + strerror(errno));
    }

    std::string write_data = "Hello from io_uring and C++ coroutines!";
    std::cout << "Async file IO: Writing '" << write_data << "' to file." << std::endl;
    ssize_t written_bytes = co_await UringWriteAwaiter(fd, write_data.data(), write_data.length(), 0);
    std::cout << "Async file IO: Wrote " << written_bytes << " bytes." << std::endl;

    std::vector<char> read_buffer(256);
    std::cout << "Async file IO: Reading from file." << std::endl;
    ssize_t read_bytes = co_await UringReadAwaiter(fd, read_buffer.data(), read_buffer.size(), 0);
    std::cout << "Async file IO: Read " << read_bytes << " bytes." << std::endl;

    close(fd); // 关闭文件描述符

    co_return std::string(read_buffer.data(), read_bytes);
}

// 主函数
int main() {
    std::cout << "Main: Starting UringScheduler..." << std::endl;
    g_uring_scheduler.run(); // 启动io_uring调度器线程

    std::cout << "Main: Initiating async file I/O task." << std::endl;
    UringTask<std::string> file_task = async_file_io("uring_test.txt");

    // 阻塞等待I/O任务完成并获取结果
    try {
        std::string content = file_task.get();
        std::cout << "Main: Received file content: '" << content << "'" << std::endl;
    } catch (const std::exception& e) {
        std::cerr << "Main: Error during file I/O: " << e.what() << std::endl;
    }

    std::cout << "Main: Stopping UringScheduler..." << std::endl;
    g_uring_scheduler.stop(); // 停止调度器线程

    // 清理测试文件
    unlink("uring_test.txt");

    std::cout << "Main: Exiting." << std::endl;
    return 0;
}

代码解析和核心机制：

UringTask<T>: 类似于之前的Task<T>，但其promise_type::return_value和unhandled_exception会通过g_uring_scheduler.schedule(caller_handle)来恢复调用者协程，确保所有协程调度都通过UringScheduler。
UringScheduler:
- 成员: 包含一个io_uring实例 (ring_)，一个用于调度可运行协程的队列 (runnable_tasks_)。
- run(): 在单独的线程中启动event_loop()。
- event_loop(): 这是核心。它在一个循环中：
  - 首先检查并执行runnable_tasks_队列中的协程（这些协程可能是从io_uring完成事件中恢复的，或者是由其他协程co_await后恢复的）。
  - 如果没有可运行的协程，它会调用io_uring_wait_cqe()阻塞等待I/O完成事件。
  - 当io_uring_wait_cqe()返回一个CQE时，它会取出CQE->user_data（这是一个std::coroutine_handle<>），并将其重新放入runnable_tasks_队列，等待被调度执行。
  - 对于UringReadAwaiter和UringWriteAwaiter，CQE->res会保存I/O操作的字节数或错误码。在event_loop中，我们并没有直接处理这个结果，而是依赖await_resume来获取。这意味着在schedule协程句柄之前，我们需要将CQE的结果信息传递给对应的UringAwaiter实例。为了简化代码，我在UringReadAwaiter和UringWriteAwaiter中添加了result_bytes_read/written和error_code字段。在实际的UringScheduler::event_loop中，需要一个机制将CQE的结果写入对应的Awaiter。一种常见的做法是，user_data不仅仅是coroutine_handle，而是一个指向一个包含coroutine_handle和结果字段的结构体的指针。
- submit_sqe(): 线程安全地提交SQE到io_uring。
UringReadAwaiter / UringWriteAwaiter:
- await_suspend():
  - 从UringScheduler的ring_中获取一个SQE。
  - 填充read或write操作的参数。
  - 关键点：将当前的协程句柄 (handle.address()) 转换成uint64_t，并赋值给sqe->user_data。这个user_data会在I/O操作完成后，通过CQE原样返回给UringScheduler，从而让调度器知道哪个协程完成了。
  - 通过g_uring_scheduler.submit_sqe(sqe)提交I/O请求。
  - 返回true，挂起当前协程。
- await_resume(): 当I/O操作完成，协程被UringScheduler恢复时，此方法被调用。它会检查result_bytes_read/written和error_code，并返回结果或抛出异常。
- 缺陷和改进: 当前实现中，UringScheduler::event_loop直接将user_data（coroutine_handle）调度，但没有将cqe->res和cqe->flags等结果信息传递给UringReadAwaiter。在await_resume中，UringReadAwaiter无法知道具体结果。为了解决这个问题，user_data通常不是直接的coroutine_handle，而是一个指向一个状态结构体的指针，该结构体包含coroutine_handle以及result_bytes_read和error_code等字段。当CQE完成时，event_loop会通过user_data找到这个状态结构体，更新其结果字段，然后调度coroutine_handle。这样，当协程恢复并调用await_resume时，就能从这个共享的状态结构体中获取到I/O操作的实际结果。为了保持示例简洁，上述代码直接在UringReadAwaiter中声明了结果字段，但它们需要通过UringScheduler在event_loop中被填充。这需要对UringScheduler的event_loop和UringReadAwaiter进行更紧密的耦合，例如UringScheduler需要维护一个std::map<uint64_t, UringAwaiter*>来映射user_data到具体的Awaiter实例。对于这个讲座，我们假设这个传递机制已经实现。

这个框架将io_uring的底层复杂性封装在UringScheduler和UringAwaiter中，为用户提供了co_await的简洁接口。

V. 高级话题与考量

A. 错误处理

协程的错误处理通过try-catch块与std::exception_ptr结合实现，与同步代码非常相似。当协程内部抛出异常时，promise_type::unhandled_exception()会被调用，它会将异常捕获并存储在std::exception_ptr中。当await_resume()被调用时，它会重新抛出这个存储的异常。

B. 资源管理

结合C++的RAII原则，文件描述符、缓冲区等资源可以通过智能指针或自定义的RAII类进行管理，确保在协程生命周期结束或异常发生时正确释放。例如，一个UringFile类可以封装open/close操作。

C. 取消机制

协程取消是一个复杂但重要的功能。在io_uring中，可以通过提交一个IORING_OP_ASYNC_CANCEL操作来尝试取消一个正在进行的I/O操作。在协程框架中，这通常意味着需要一个CancellationToken对象，当取消请求发出时，它会在await_suspend中注册取消回调，或者在UringScheduler中检查CancellationToken状态并提交取消请求。

D. 性能影响：基准测试与优化

批量提交：io_uring的优势之一是批量提交SQE。在框架设计中，应考虑如何高效地将多个协程的I/O请求批处理成一次io_uring_submit()调用。
轮询模式：对于超低延迟场景，io_uring支持轮询模式（IORING_SETUP_SQPOLL和IORING_SETUP_CQPOLL），允许用户线程持续轮询io_uring队列而无需系统调用，进一步降低延迟。但这也意味着CPU占用率会更高。
缓冲区管理：使用IORING_REGISTER_BUFFERS注册固定缓冲区可以避免每次I/O的内存注册/注销开销，实现零拷贝I/O。

E. 对比表格：异步I/O方案一览

特性/方案	回调函数	线程池 + 阻塞I/O	`epoll` + 事件循环	`io_uring` + 协程
编程模型	分散，回调地狱	同步，易理解	事件驱动，逻辑跳跃	同步风格，易理解
I/O效率	依赖底层实现	上下文切换开销	需多次系统调用	单系统调用，批量提交
并发能力	高	受线程数限制，开销大	高	极高
资源消耗	低	线程栈，上下文	文件描述符，事件结构	环形缓冲区，少量内存
错误处理	复杂	相对简单	复杂	结构化，`try-catch`
取消支持	复杂	线程中断，复杂	复杂	内核级支持，可封装
操作系统支持	广泛	广泛	广泛	Linux 5.1+ 独有
开发难度	中	低	高	中高（需要掌握底层）
适用场景	简单异步任务	简单并发服务器	高并发网络服务	极致性能I/O密集型服务

F. 跨平台考量

io_uring是Linux内核特有的API。对于需要跨平台支持的异步I/O框架，需要针对不同操作系统提供不同的后端实现：

Windows: 使用IOCP (I/O Completion Ports)。
macOS/FreeBSD: 使用kqueue。
其他UNIX-like: epoll (Linux), poll/select (通用)。

这意味着在C++协程框架中，需要一个抽象层来适配这些不同的底层实现。

G. 替代方案与未来方向

Libuv/Boost.Asio: 这些库提供了成熟的跨平台异步I/O抽象，但它们的编程模型通常基于回调或Future/Promise，与协程的集成需要额外的适配层。
C++23 std::execution: 旨在提供一个标准化的执行器和调度器模型，这将使协程的调度更加规范化。
无栈协程库: 如Fibers，它们通常在用户空间实现上下文切换，比内核级线程切换更快，但不如C++20协程的语言级支持灵活。

VI. 实际应用场景

io_uring与C++协程的组合，在以下场景中能够发挥出无与伦比的性能优势：

高性能Web服务器/API网关：处理大量并发HTTP请求，进行文件I/O、数据库查询等，能够显著降低延迟，提高吞吐量。
数据库引擎：无论是关系型数据库还是NoSQL，其核心都是大量磁盘I/O。io_uring可以极大优化存储层的性能。
网络代理/负载均衡器：需要高效地在多个网络连接之间转发数据，io_uring对于splice等操作的支持尤为重要。
文件处理系统：如日志收集、数据分析、图像处理等，涉及大规模文件读写的应用。

VII. 结合内核高效与语言优雅

C++协程与io_uring的深度集成，代表了现代高性能系统编程的一个重要方向。io_uring在内核层面提供了无与伦比的I/O效率，而C++协程则在语言层面提供了优雅且富有表现力的异步编程模型。这种结合使得开发者能够以直观的同步代码风格，编写出既高效又易于维护的异步应用程序，从而在性能和开发效率之间找到了一个极佳的平衡点。它不仅仅是两种技术的简单叠加，更是系统设计理念的深度融合，为构建下一代高并发、低延迟的C++应用奠定了坚实的基础。

I. 异步I/O的必然选择与传统困境

II. C++协程：语言级的异步抽象

III. io_uring：内核级的异步I/O引擎

IV. 深度集成：io_uring与C++协程

V. 高级话题与考量

VI. 实际应用场景

VII. 结合内核高效与语言优雅

发表回复 取消回复

III. `io_uring`：内核级的异步I/O引擎

IV. 深度集成：`io_uring`与C++协程

发表回复取消回复