C++ 外部内存管理：与操作系统或其他库的内存接口 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

好的，各位听众，今天咱们来聊聊C++里的“外挂”——外部内存管理！别误会，不是游戏外挂，而是指C++程序如何跟操作系统或其他库“勾搭”上，去申请和管理内存，而不是完全依赖C++自带的new和delete。

为什么需要外部内存管理？

你可能会问：“new和delete用得挺好的，为什么要费劲巴拉地去搞外部内存管理？” 问得好！原因有很多，就像你不能指望一个厨师只用一把菜刀做出满汉全席一样：

性能优化： new和delete在某些场景下效率可能不高。比如，频繁地分配和释放小块内存，容易产生内存碎片。而自定义的内存池或者使用其他库提供的内存管理方案，可以更好地控制内存分配策略，减少碎片，提高性能。想象一下，你玩俄罗斯方块，如果每次都随机出现方块，很快就堆满了；但如果事先规划好方块的顺序和位置，就能玩得更久。
内存控制： C++默认的内存分配器，你没法完全掌控它的行为。如果你需要对内存的使用进行更精细的控制，比如限制内存的使用量，或者在特定地址分配内存，就需要借助外部内存管理。这就像你租房，房东的规矩你没法改，但如果你自己买房，就可以随便装修了。
与其他系统集成： 有些操作系统或库提供了自己的内存管理机制。为了与这些系统更好地集成，你需要使用它们提供的内存分配接口。比如，你用OpenGL做图形渲染，它会提供自己的内存分配函数来管理纹理和顶点数据。
定制化需求： 特定的应用场景可能需要定制化的内存管理方案。比如，实时系统对内存分配的延迟有严格的要求，就需要使用专门的内存分配器。这就像赛车，需要根据不同的赛道和天气条件，对轮胎进行调整。

外部内存管理的“姿势”

那么，C++程序如何与外部内存“眉来眼去”呢？主要有以下几种方式：

操作系统提供的API： 这是最底层的方式，直接调用操作系统提供的内存分配函数。比如，Windows下的HeapAlloc和HeapFree，Linux下的mmap和munmap。
第三方库： 有很多优秀的第三方库提供了更高级的内存管理功能，比如Boost.Pool，jemalloc，tcmalloc等。
自定义内存池： 自己实现一个内存池，管理一块大的内存区域，然后从中分配和释放小块内存。

实战演练：Windows API

咱们先来个简单的例子，用Windows API来分配和释放内存：

#include <iostream>
#include <windows.h>

int main() {
  // 获取默认堆句柄
  HANDLE hHeap = GetProcessHeap();
  if (hHeap == NULL) {
    std::cerr << "获取堆句柄失败：" << GetLastError() << std::endl;
    return 1;
  }

  // 分配内存
  SIZE_T size = 1024; // 分配1024字节
  void* p = HeapAlloc(hHeap, 0, size);
  if (p == NULL) {
    std::cerr << "内存分配失败：" << GetLastError() << std::endl;
    return 1;
  }

  std::cout << "分配的内存地址：" << p << std::endl;

  // 使用内存
  memset(p, 0, size); // 初始化为0

  // 释放内存
  if (HeapFree(hHeap, 0, p) == FALSE) {
    std::cerr << "内存释放失败：" << GetLastError() << std::endl;
    return 1;
  }

  std::cout << "内存已释放" << std::endl;

  return 0;
}

这个例子很简单，首先通过GetProcessHeap()获取当前进程的默认堆句柄，然后用HeapAlloc()分配内存，用HeapFree()释放内存。注意，HeapAlloc()的第二个参数是标志，一般用0。

实战演练：Linux API (mmap)

再来个Linux下的例子，用mmap和munmap来玩转内存：

#include <iostream>
#include <sys/mman.h>
#include <unistd.h>
#include <cerrno>

int main() {
    size_t size = 4096; // 4KB, 必须是页大小的倍数
    void* p = mmap(NULL, size, PROT_READ | PROT_WRITE, MAP_ANONYMOUS | MAP_PRIVATE, -1, 0);

    if (p == MAP_FAILED) {
        std::cerr << "mmap failed: " << strerror(errno) << std::endl;
        return 1;
    }

    std::cout << "Allocated memory at: " << p << std::endl;

    // 使用内存
    memset(p, 0, size);

    // 释放内存
    if (munmap(p, size) == -1) {
        std::cerr << "munmap failed: " << strerror(errno) << std::endl;
        return 1;
    }

    std::cout << "Memory unmapped" << std::endl;

    return 0;
}

mmap是一个非常强大的函数，可以将文件或设备映射到内存中，也可以分配匿名内存。这里我们用MAP_ANONYMOUS和MAP_PRIVATE来分配匿名私有内存。注意，mmap分配的内存大小必须是页大小的倍数，可以用sysconf(_SC_PAGE_SIZE)来获取页大小。

实战演练：Boost.Pool

Boost.Pool是一个非常流行的内存池库，使用起来也很方便：

#include <iostream>
#include <boost/pool/pool.hpp>

int main() {
  // 创建一个 pool 对象，用于分配 sizeof(int) 大小的内存块
  boost::pool<> p(sizeof(int));

  // 分配内存
  int* ptr1 = (int*)p.malloc();
  int* ptr2 = (int*)p.malloc();

  std::cout << "ptr1: " << ptr1 << std::endl;
  std::cout << "ptr2: " << ptr2 << std::endl;

  // 使用内存
  *ptr1 = 10;
  *ptr2 = 20;

  // 释放内存
  p.free(ptr1);
  p.free(ptr2);

  return 0;
}

这个例子中，我们创建了一个boost::pool<>对象，指定了每个内存块的大小为sizeof(int)。然后用malloc()分配内存，用free()释放内存。注意，Boost.Pool的malloc()和free()只是接口上像C的malloc()和free()，实际上它们是在内存池内部进行分配和释放。

实战演练：自定义内存池

下面我们来实现一个简单的内存池：

#include <iostream>
#include <vector>

class MemoryPool {
public:
  MemoryPool(size_t chunkSize, size_t initialSize) : chunkSize_(chunkSize) {
    allocateNewBlock(initialSize);
  }

  ~MemoryPool() {
    for (char* block : blocks_) {
      delete[] block;
    }
  }

  void* allocate() {
    if (freePointers_.empty()) {
      allocateNewBlock(blocks_.back() ? blocks_.back_size() : 1024); // Double the last block size or start with 1024
    }

    void* ptr = freePointers_.back();
    freePointers_.pop_back();
    return ptr;
  }

  void deallocate(void* ptr) {
    freePointers_.push_back(static_cast<char*>(ptr));
  }

private:
    struct BlockInfo {
        char* data;
        size_t size;
    };

    void allocateNewBlock(size_t size) {
        char* newBlock = new char[chunkSize_ * size];
        blocks_.push_back(newBlock);
        blocks_.back_size(size);

        for (size_t i = 0; i < size; ++i) {
            freePointers_.push_back(newBlock + i * chunkSize_);
        }
    }

  size_t chunkSize_;
  std::vector<char*> blocks_;

  struct BlockSize {
    size_t size;
    BlockSize(size_t s) : size(s) {}
    operator size_t() { return size;}
    BlockSize& operator = (size_t s) { size = s; return *this;}
  };

  std::vector<char*>::size_reference blocks_size() {
    return reinterpret_cast<std::vector<char*>::size_reference>(blocks_.size());
  }

  BlockSize blocks_.back_size() {
    return reinterpret_cast<BlockSize>(blocks_.back() ? sizeof(blocks_.back()) : 0);
  }

  std::vector<char*> freePointers_;
};

int main() {
  MemoryPool pool(sizeof(int), 10); // 每个块大小为 sizeof(int)，初始分配 10 个块

  int* ptr1 = (int*)pool.allocate();
  int* ptr2 = (int*)pool.allocate();

  std::cout << "ptr1: " << ptr1 << std::endl;
  std::cout << "ptr2: " << ptr2 << std::endl;

  *ptr1 = 100;
  *ptr2 = 200;

  std::cout << "*ptr1: " << *ptr1 << std::endl;
  std::cout << "*ptr2: " << *ptr2 << std::endl;

  pool.deallocate(ptr1);
  pool.deallocate(ptr2);

  return 0;
}

这个内存池的实现思路是：

预先分配一大块内存，分成若干个固定大小的块。
维护一个空闲块链表，记录哪些块是空闲的。
当需要分配内存时，从空闲块链表中取出一个块。
当释放内存时，将释放的块放回空闲块链表。

这个例子只是一个简单的演示，实际的内存池实现要考虑更多的问题，比如线程安全、内存对齐、碎片整理等。

各种方法的优缺点

为了方便大家选择，我把各种内存管理方法的优缺点总结一下：

方法	优点	缺点	适用场景
操作系统API	最底层，控制力最强，可以实现各种定制化的内存管理策略。	使用复杂，需要了解操作系统的内存管理机制，容易出错。	需要对内存进行精细控制，或者需要与其他系统集成。
第三方库	提供了高级的内存管理功能，使用方便，性能通常也比较好。	依赖第三方库，可能会引入额外的依赖和兼容性问题。	对性能有一定要求，但又不想自己实现内存池。
自定义内存池	可以根据应用场景进行定制化，避免内存碎片，提高性能。	实现复杂，需要考虑很多细节问题，容易出错。	对性能要求非常高，或者需要定制化的内存管理策略。
C++ `new`/`delete`	使用简单方便，无需额外依赖。	在频繁分配和释放小块内存时，容易产生内存碎片，性能可能不高。无法对内存的使用进行精细控制。	对性能要求不高，或者内存分配和释放的频率不高。

注意事项

在使用外部内存管理时，一定要注意以下几点：

内存泄漏： 无论是使用操作系统API，还是第三方库，或者自定义内存池，都要确保分配的内存最终都被释放，否则就会造成内存泄漏。
重复释放： 不要重复释放同一块内存，否则会导致程序崩溃。
内存越界： 不要访问超出已分配内存范围的区域，否则会导致程序崩溃或者数据损坏。
对齐问题： 有些硬件平台对内存地址有对齐要求，比如要求地址是4的倍数或者8的倍数。如果不满足对齐要求，可能会导致性能下降或者程序崩溃。
异常安全： 如果在分配内存后，代码抛出了异常，一定要确保之前分配的内存被释放，否则就会造成内存泄漏。可以使用RAII（Resource Acquisition Is Initialization）技术来解决这个问题。

总结

好了，今天关于C++外部内存管理就聊到这里。希望通过今天的讲解，大家对外部内存管理有了更深入的了解。记住，选择合适的内存管理方案，就像选择合适的武器一样，可以让你在编程的战场上更加游刃有余！

如果大家还有什么问题，欢迎提问！

发表回复 取消回复

发表回复取消回复