C++ `std::pmr::synchronized_pool_resource`：线程安全内存池 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

好的，各位观众老爷，今天咱们来聊聊C++里一个挺有意思的东西，std::pmr::synchronized_pool_resource。这玩意儿说白了，就是一个线程安全的内存池。听起来是不是有点高大上？别怕，咱用大白话给你掰开了揉碎了讲清楚。

啥是内存池？

首先，咱们得搞明白啥是内存池。你想啊，程序运行的时候，经常要分配和释放内存。如果每次都直接跟操作系统要，那效率就太低了。你想，你每次想喝水都得自己打井，那多费劲？

内存池就像一个水库，它事先向操作系统申请一大块内存，然后自己管理这块内存。当程序需要内存的时候，就从水库里取一块；程序不用的时候，就把内存还给水库。这样一来，就省去了频繁跟操作系统打交道的开销，大大提高了内存分配和释放的效率。

std::pmr是个啥？

std::pmr，全称是std::polymorphic_memory_resource，是C++17引入的一个新特性。它提供了一种更灵活、更可定制的内存管理方式。你可以把它理解成一个内存分配器的抽象接口。通过使用std::pmr，你可以很方便地替换程序的默认内存分配器，而不需要修改大量的代码。

synchronized_pool_resource：线程安全的内存池

好了，现在咱们进入正题，说说今天的主角std::pmr::synchronized_pool_resource。这玩意儿就是一个线程安全的内存池。啥叫线程安全？就是说，多个线程可以同时使用这个内存池，而不用担心出现数据竞争或者其他奇奇怪怪的问题。

synchronized_pool_resource的工作原理是这样的：

内部维护一个或多个内存块（chunk）: 当它需要内存时，它会从这些块中分配。
使用互斥锁（mutex）进行同步: 确保多个线程访问内存池时不会发生冲突。
可以关联一个上游内存资源（upstream memory resource）: 如果池子里的内存不够用，它会向上游请求更多的内存。

为啥要用synchronized_pool_resource？

提高效率： 避免频繁地向操作系统申请和释放内存，减少开销。
减少内存碎片： 内存池可以更好地管理内存，减少内存碎片的产生。
线程安全： 多个线程可以安全地使用同一个内存池，简化多线程编程。
可定制性： 可以通过指定上游内存资源来定制内存分配的行为。

synchronized_pool_resource怎么用？

首先，你需要包含头文件 <memory_resource>。

#include <memory_resource>
#include <vector>
#include <iostream>
#include <thread>
#include <mutex>

using namespace std;
using namespace std::pmr;

接下来，你可以创建一个synchronized_pool_resource对象。

// 使用默认的内存分配器作为上游
synchronized_pool_resource pool;

// 或者，你可以指定一个上游内存分配器
monotonic_buffer_resource buffer(1024); // 一个简单的基于buffer的内存资源
synchronized_pool_resource pool_with_buffer(&buffer);

然后，你可以使用这个内存池来分配内存。最常见的用法是与std::pmr::vector等容器一起使用。

// 使用内存池 pool 分配内存
vector<int> vec(&pool);
vec.reserve(100); // 预留空间，避免频繁分配内存
for (int i = 0; i < 100; ++i) {
    vec.push_back(i);
}

// 使用内存池 pool_with_buffer 分配内存
vector<double> vec2(&pool_with_buffer);
vec2.reserve(50);
for (int i = 0; i < 50; ++i) {
    vec2.push_back(i * 1.0);
}

一个更完整的例子：多线程使用synchronized_pool_resource

#include <memory_resource>
#include <vector>
#include <iostream>
#include <thread>
#include <mutex>
#include <chrono>

using namespace std;
using namespace std::pmr;

// 全局内存池
synchronized_pool_resource global_pool;
mutex print_mutex; // 保护 cout 的互斥锁

void thread_func(int thread_id) {
    // 使用全局内存池
    vector<int> vec(&global_pool);
    vec.reserve(1000);

    for (int i = 0; i < 1000; ++i) {
        vec.push_back(thread_id * 1000 + i);
    }

    {
        lock_guard<mutex> lock(print_mutex); // 保证输出的线程安全
        cout << "Thread " << thread_id << ": Vector size = " << vec.size() << endl;
        // 可以选择打印一些元素来验证数据
        // cout << "Thread " << thread_id << ": First element = " << vec[0] << endl;
        // cout << "Thread " << thread_id << ": Last element = " << vec[vec.size() - 1] << endl;
    }
}

int main() {
    vector<thread> threads;
    for (int i = 0; i < 4; ++i) {
        threads.emplace_back(thread_func, i);
    }

    for (auto& t : threads) {
        t.join();
    }

    cout << "All threads finished." << endl;

    return 0;
}

在这个例子中，我们创建了一个全局的synchronized_pool_resource，并在多个线程中使用它来分配vector的内存。由于synchronized_pool_resource是线程安全的，所以我们不需要担心多个线程同时访问内存池时出现问题。

synchronized_pool_resource的构造函数

synchronized_pool_resource 有以下几个构造函数：

synchronized_pool_resource(const pool_options& opts, memory_resource* upstream): 使用指定的 pool_options 和上游内存资源。 pool_options 可以控制 chunk 的大小和最大块的数量。
synchronized_pool_resource(memory_resource* upstream): 使用默认的 pool_options 和指定的上游内存资源。
synchronized_pool_resource(): 使用默认的 pool_options 和 new_delete_resource() 作为上游内存资源。

pool_options是个啥？

pool_options 结构体允许你配置内存池的行为。它有两个成员：

size_t max_blocks_per_chunk: 每个 chunk 中最大块的数量。
size_t largest_required_pool_block: 内存池可以处理的最大块的大小。

通过调整这两个参数，你可以根据你的应用程序的需要来优化内存池的性能。例如，如果你的应用程序需要分配大量的非常小的对象，你可以增加 max_blocks_per_chunk 的值。如果你的应用程序需要分配一些很大的对象，你需要确保 largest_required_pool_block 的值足够大。

synchronized_pool_resource的成员函数

memory_resource* upstream_resource() const: 返回上游内存资源。
void release(): 释放所有已分配的内存块。
void* allocate(size_t bytes, size_t alignment = alignof(max_align_t)): 分配指定大小和对齐方式的内存。
void deallocate(void* p, size_t bytes, size_t alignment = alignof(max_align_t)): 释放之前分配的内存。
bool is_equal(const memory_resource& other) const noexcept: 比较两个内存资源是否相等。

synchronized_pool_resource的注意事项

上游内存资源的选择： 选择合适的上游内存资源非常重要。如果你的应用程序需要分配大量的内存，你应该选择一个高效的内存分配器作为上游。 new_delete_resource() 是默认的上游，它使用 new 和 delete 进行内存分配和释放。你也可以使用 monotonic_buffer_resource 或自定义的内存资源。
内存泄漏： 使用完内存池后，一定要记得释放所有已分配的内存。可以通过调用 release() 函数来释放内存。否则，可能会导致内存泄漏。
线程安全： synchronized_pool_resource 是线程安全的，但是你仍然需要注意其他线程安全问题。例如，如果多个线程同时访问同一个 vector，你需要使用互斥锁来保护 vector。

synchronized_pool_resource vs. unsynchronized_pool_resource

C++ 标准库还提供了 std::pmr::unsynchronized_pool_resource。 unsynchronized_pool_resource 和 synchronized_pool_resource 的区别在于，unsynchronized_pool_resource 不是线程安全的。因此，如果你的应用程序是单线程的，或者你已经使用了其他方式来保证线程安全，那么你可以使用 unsynchronized_pool_resource 来提高性能。

什么时候应该使用synchronized_pool_resource？

多线程应用程序： 当你的应用程序是多线程的，并且多个线程需要同时分配和释放内存时，应该使用synchronized_pool_resource。
性能敏感的应用程序： 当你的应用程序对性能要求很高，并且频繁地分配和释放内存时，应该使用synchronized_pool_resource。
需要控制内存分配行为的应用程序： 当你需要控制内存分配的行为，例如限制内存使用量或使用自定义的内存分配器时，可以使用synchronized_pool_resource。

表格总结

特性	`synchronized_pool_resource`	`unsynchronized_pool_resource`
线程安全	是	否
性能	相对较低	相对较高
适用场景	多线程环境	单线程或已保证线程安全的环境
默认上游内存资源	`new_delete_resource()`	`new_delete_resource()`
是否需要额外同步措施	否	是

高级用法：自定义上游内存资源

你可以通过实现自己的 memory_resource 类来定制内存分配的行为。例如，你可以创建一个从共享内存中分配内存的 memory_resource 类，或者创建一个使用自定义的内存分配算法的 memory_resource 类。

下面是一个简单的例子，演示如何创建一个基于 malloc 和 free 的 memory_resource 类：

#include <memory_resource>
#include <cstdlib> // For malloc and free

class malloc_resource : public memory_resource {
public:
    malloc_resource() = default;

protected:
    void* do_allocate(size_t bytes, size_t alignment) override {
        void* ptr = aligned_alloc(alignment, bytes);
        if (ptr == nullptr) {
            throw std::bad_alloc();
        }
        return ptr;
    }

    void do_deallocate(void* p, size_t bytes, size_t alignment) override {
        free(p);
    }

    bool do_is_equal(const memory_resource& other) const noexcept override {
        return this == &other; // Only equal if they are the same object
    }
};

int main() {
    malloc_resource my_resource;
    synchronized_pool_resource pool(&my_resource);

    vector<int> vec(&pool);
    vec.reserve(100);
    for (int i = 0; i < 100; ++i) {
        vec.push_back(i);
    }

    std::cout << "Vector size: " << vec.size() << std::endl;

    return 0;
}

在这个例子中，我们创建了一个名为 malloc_resource 的类，它继承自 memory_resource。我们重写了 do_allocate 和 do_deallocate 函数，使用 malloc 和 free 来分配和释放内存。然后，我们将 malloc_resource 对象传递给 synchronized_pool_resource 的构造函数，使其使用我们自定义的内存分配器。

总结

std::pmr::synchronized_pool_resource 是一个非常有用的工具，可以帮助你提高多线程应用程序的内存管理效率和线程安全性。通过了解其工作原理、使用方法和注意事项，你可以更好地利用它来优化你的应用程序。

好了，今天的讲座就到这里。希望大家有所收获！如果大家还有什么问题，欢迎提问。

发表回复 取消回复

发表回复取消回复