C++实现内存的大页（HugePages）管理：减少TLB Miss与提高内存访问效率

大家好，今天我们来聊聊C++中如何利用大页（HugePages）来管理内存，以减少TLB Miss并提高内存访问效率。在高性能计算、大数据处理等场景下，内存管理至关重要。传统的小页（通常是4KB）在处理大量数据时会产生大量的TLB Miss，影响性能。大页则可以通过减少TLB条目数量，提高TLB命中率，从而显著提升性能。

1. 什么是大页（HugePages）？

简单来说，大页就是比标准页更大的内存页。标准页的大小通常是4KB，而大页的大小则根据操作系统和硬件平台而异，常见的有2MB、1GB等。

为什么需要大页？

为了理解大页的优势，我们需要先了解一下TLB (Translation Lookaside Buffer)。TLB是CPU中的一个缓存，用于存储虚拟地址到物理地址的映射。当CPU访问一个虚拟地址时，首先会查找TLB中是否存在对应的映射。如果存在，则可以直接得到物理地址，这被称为TLB命中。如果不存在，则需要进行页表查询，这被称为TLB Miss。页表查询是一个相对较慢的过程，会显著降低内存访问速度。

当程序使用的内存空间很大时，就需要大量的页表条目来映射虚拟地址到物理地址。这会导致TLB缓存的条目不足，从而产生大量的TLB Miss。大页可以通过减少所需页表条目的数量来缓解这个问题。例如，如果使用2MB的大页，只需要一个页表条目就可以映射2MB的内存空间，而使用4KB的小页则需要512个页表条目。

优势总结：

减少TLB Miss： 减少了页表条目的数量，提高了TLB命中率。
提高内存访问速度： 减少了页表查询的次数，加快了内存访问速度。
降低内存管理开销： 减少了页表管理的开销。

缺点：

内部碎片： 如果分配的大页没有完全使用，会造成内存浪费。
分配限制： 大页的分配可能受到操作系统和硬件平台的限制。
管理复杂性： 大页的管理比小页更加复杂。

2. 如何在Linux系统上配置大页？

在Linux系统上，可以通过以下步骤配置大页：

查看当前系统支持的大页大小：
```
cat /proc/meminfo | grep Hugepagesize
```
输出类似：Hugepagesize: 2048 kB，表示系统支持2MB的大页。
设置需要预留的大页数量：
```
sudo sysctl -w vm.nr_hugepages=128  # 预留128个大页（2MB）
```
或者，修改/etc/sysctl.conf文件，添加vm.nr_hugepages=128，然后执行sudo sysctl -p使配置生效。
验证大页是否成功预留：
```
cat /proc/meminfo | grep HugePages
```
检查HugePages_Total是否等于预留的大页数量，HugePages_Free是否接近HugePages_Total。

3. C++中使用大页的几种方法

C++本身并没有直接支持大页分配的内置功能。我们需要借助操作系统提供的API来实现大页内存的分配和管理。以下是几种常用的方法：

方法一：使用 mmap 系统调用

mmap 是一个强大的系统调用，可以将文件或设备映射到内存中。我们可以利用 mmap 结合 /dev/hugepages 来分配大页内存。

#include <iostream>
#include <sys/mman.h>
#include <fcntl.h>
#include <unistd.h>
#include <errno.h>
#include <string.h>

// 定义大页大小 (根据你的系统配置修改)
#define HUGE_PAGE_SIZE (2 * 1024 * 1024)

// 定义分配的大页数量
#define NUM_HUGE_PAGES 1

int main() {
    // 计算需要分配的总内存大小
    size_t total_size = NUM_HUGE_PAGES * HUGE_PAGE_SIZE;

    // 打开 /dev/hugepages
    int fd = open("/dev/hugepages", O_RDWR);
    if (fd < 0) {
        std::cerr << "Failed to open /dev/hugepages: " << strerror(errno) << std::endl;
        return 1;
    }

    // 使用 mmap 分配大页内存
    void* addr = mmap(NULL, total_size, PROT_READ | PROT_WRITE, MAP_SHARED, fd, 0);
    if (addr == MAP_FAILED) {
        std::cerr << "mmap failed: " << strerror(errno) << std::endl;
        close(fd);
        return 1;
    }

    // 关闭文件描述符
    close(fd);

    // 现在 addr 指向分配的大页内存
    std::cout << "Successfully allocated " << total_size / (1024 * 1024) << " MB of huge pages at address: " << addr << std::endl;

    // 可以像使用普通内存一样使用 addr
    // 例如，写入数据
    memset(addr, 0x42, total_size); // 用 0x42 填充内存

    // 释放内存
    if (munmap(addr, total_size) < 0) {
        std::cerr << "munmap failed: " << strerror(errno) << std::endl;
        return 1;
    }

    std::cout << "Successfully unmapped huge pages." << std::endl;

    return 0;
}

代码解释:

open("/dev/hugepages", O_RDWR)：打开 /dev/hugepages 文件，用于分配大页内存。
mmap(NULL, total_size, PROT_READ | PROT_WRITE, MAP_SHARED, fd, 0)：使用 mmap 系统调用分配大页内存。
- NULL: 让系统选择分配的地址。
- total_size: 需要分配的内存大小。
- PROT_READ | PROT_WRITE: 设置内存的读写权限。
- MAP_SHARED: 指定映射类型为共享映射，这意味着多个进程可以共享同一块内存。
- fd: /dev/hugepages 的文件描述符。
- 0: 文件偏移量，始终为0。
munmap(addr, total_size)：释放分配的大页内存。

注意事项：

确保系统已经预留了足够的大页。
编译时需要链接 -lrt 库。

方法二：使用 shmget 和 shmat 系统调用

shmget 用于创建或获取共享内存段，shmat 用于将共享内存段连接到进程的地址空间。我们可以利用这两个系统调用来分配大页内存。

#include <iostream>
#include <sys/ipc.h>
#include <sys/shm.h>
#include <errno.h>
#include <string.h>

// 定义大页大小 (根据你的系统配置修改)
#define HUGE_PAGE_SIZE (2 * 1024 * 1024)

// 定义分配的大页数量
#define NUM_HUGE_PAGES 1

int main() {
    // 计算需要分配的总内存大小
    size_t total_size = NUM_HUGE_PAGES * HUGE_PAGE_SIZE;

    // 创建共享内存段
    int shmid = shmget(IPC_PRIVATE, total_size, IPC_CREAT | SHM_HUGETLB | 0666);
    if (shmid < 0) {
        std::cerr << "shmget failed: " << strerror(errno) << std::endl;
        return 1;
    }

    // 将共享内存段连接到进程的地址空间
    void* addr = shmat(shmid, NULL, 0);
    if (addr == (void*) -1) {
        std::cerr << "shmat failed: " << strerror(errno) << std::endl;
        shmctl(shmid, IPC_RMID, NULL); // 删除共享内存段
        return 1;
    }

    // 现在 addr 指向分配的大页内存
    std::cout << "Successfully allocated " << total_size / (1024 * 1024) << " MB of huge pages at address: " << addr << std::endl;

    // 可以像使用普通内存一样使用 addr
    // 例如，写入数据
    memset(addr, 0x42, total_size); // 用 0x42 填充内存

    // 从进程的地址空间分离共享内存段
    if (shmdt(addr) < 0) {
        std::cerr << "shmdt failed: " << strerror(errno) << std::endl;
        return 1;
    }

    // 删除共享内存段
    if (shmctl(shmid, IPC_RMID, NULL) < 0) {
        std::cerr << "shmctl failed: " << strerror(errno) << std::endl;
        return 1;
    }

    std::cout << "Successfully detached and removed shared memory segment." << std::endl;

    return 0;
}

代码解释：

shmget(IPC_PRIVATE, total_size, IPC_CREAT | SHM_HUGETLB | 0666)：创建共享内存段。
- IPC_PRIVATE: 创建一个私有的共享内存段。
- total_size: 需要分配的内存大小。
- IPC_CREAT: 如果共享内存段不存在，则创建它。
- SHM_HUGETLB: 指定使用大页内存。
- 0666: 设置共享内存段的权限。
shmat(shmid, NULL, 0)：将共享内存段连接到进程的地址空间。
- shmid: 共享内存段的ID。
- NULL: 让系统选择连接的地址。
- 0: 标志，通常为0。
shmdt(addr)：从进程的地址空间分离共享内存段。
shmctl(shmid, IPC_RMID, NULL)：删除共享内存段。

注意事项：

确保系统已经预留了足够的大页。
编译时需要链接 -lrt 库。

方法三：使用 HugeTLBFS 文件系统

HugeTLBFS 是一个专门用于管理大页内存的文件系统。我们可以通过挂载 HugeTLBFS 文件系统，然后在该文件系统中创建文件来分配大页内存。

创建挂载点：
```
sudo mkdir /mnt/huge
```
挂载 HugeTLBFS 文件系统：
```
sudo mount -t hugetlbfs none /mnt/huge
```
如果需要开机自动挂载，可以添加到/etc/fstab文件：
```
none    /mnt/huge   hugetlbfs defaults 0 0
```

C++ 代码示例：

#include <iostream>
#include <fstream>
#include <string>
#include <cstring>
#include <unistd.h>

// 定义大页大小 (根据你的系统配置修改)
#define HUGE_PAGE_SIZE (2 * 1024 * 1024)

// 定义分配的大页数量
#define NUM_HUGE_PAGES 1

int main() {
    // 计算需要分配的总内存大小
    size_t total_size = NUM_HUGE_PAGES * HUGE_PAGE_SIZE;

    // 构建文件路径
    std::string filename = "/mnt/huge/my_huge_page";

    // 创建文件
    std::ofstream outfile(filename, std::ios::binary | std::ios::trunc);
    if (!outfile.is_open()) {
        std::cerr << "Failed to create file: " << filename << std::endl;
        return 1;
    }

    // 调整文件大小
    outfile.seekp(total_size - 1);
    outfile.write("", 1);
    outfile.close();

    // 打开文件
    std::fstream infile(filename, std::ios::binary | std::ios::in | std::ios::out);
    if (!infile.is_open()) {
        std::cerr << "Failed to open file: " << filename << std::endl;
        unlink(filename.c_str()); // 删除文件
        return 1;
    }

    // 获取文件指针
    char* addr = new char[total_size]; //分配足够的内存

    infile.read(addr, total_size);
    if (infile.fail() && !infile.eof()) {
         std::cerr << "Failed to read file: " << filename << std::endl;
         infile.close();
         unlink(filename.c_str());
         delete[] addr;
         return 1;
    }

    // 现在 addr 指向分配的大页内存
    std::cout << "Successfully allocated " << total_size / (1024 * 1024) << " MB of huge pages at address: (simulated)" << std::endl;

    // 可以像使用普通内存一样使用 addr
    // 例如，写入数据
    memset(addr, 0x42, total_size); // 用 0x42 填充内存

    // 释放内存
    infile.close();
    unlink(filename.c_str()); // 删除文件
    delete[] addr;

    std::cout << "Successfully released huge pages." << std::endl;

    return 0;
}

代码解释：

sudo mount -t hugetlbfs none /mnt/huge：挂载 HugeTLBFS 文件系统到 /mnt/huge 目录。
std::ofstream outfile(filename, std::ios::binary | std::ios::trunc)：创建一个文件，用于分配大页内存。
outfile.seekp(total_size - 1); outfile.write("", 1);：调整文件大小，使其占用指定数量的大页。
std::fstream infile(filename, std::ios::binary | std::ios::in | std::ios::out)：打开文件，用于读写大页内存。
infile.read(addr, total_size); 将文件内容读入到内存中
infile.close(); unlink(filename.c_str()); 释放大页内存。

注意事项：

确保 HugeTLBFS 文件系统已经成功挂载。
需要删除创建的文件来释放大页内存。

4. 性能测试和比较

为了验证大页的性能优势，我们可以进行一些简单的性能测试。以下是一个简单的示例，用于比较使用大页和小页的内存访问速度。

#include <iostream>
#include <chrono>
#include <vector>
#include <random>

// 定义大页大小 (根据你的系统配置修改)
#define HUGE_PAGE_SIZE (2 * 1024 * 1024)

// 定义数组大小
#define ARRAY_SIZE (1024 * 1024 * 128) // 128MB

// 定义迭代次数
#define ITERATIONS 100

// 定义是否使用大页
#define USE_HUGE_PAGES 1 // 1: 使用大页, 0: 不使用大页

#ifdef USE_HUGE_PAGES
    #include <sys/mman.h>
    #include <fcntl.h>
    #include <unistd.h>
    #include <errno.h>
    #include <string.h>
#else
    #include <cstdlib>
#endif

int main() {
    // 分配内存
    int* arr = nullptr;

    #ifdef USE_HUGE_PAGES
        // 使用 mmap 分配大页内存
        int fd = open("/dev/hugepages", O_RDWR);
        if (fd < 0) {
            std::cerr << "Failed to open /dev/hugepages: " << strerror(errno) << std::endl;
            return 1;
        }

        arr = (int*)mmap(NULL, ARRAY_SIZE * sizeof(int), PROT_READ | PROT_WRITE, MAP_SHARED, fd, 0);
        if (arr == MAP_FAILED) {
            std::cerr << "mmap failed: " << strerror(errno) << std::endl;
            close(fd);
            return 1;
        }
        close(fd);

        std::cout << "Using HugePages" << std::endl;

    #else
        // 使用 malloc 分配小页内存
        arr = (int*)malloc(ARRAY_SIZE * sizeof(int));
        if (arr == nullptr) {
            std::cerr << "malloc failed" << std::endl;
            return 1;
        }
        std::cout << "Using Regular Pages" << std::endl;

    #endif

    // 初始化数组
    for (int i = 0; i < ARRAY_SIZE; ++i) {
        arr[i] = i;
    }

    // 创建随机数生成器
    std::random_device rd;
    std::mt19937 gen(rd());
    std::uniform_int_distribution<> distrib(0, ARRAY_SIZE - 1);

    // 测量内存访问时间
    auto start = std::chrono::high_resolution_clock::now();
    for (int i = 0; i < ITERATIONS; ++i) {
        // 随机访问数组元素
        int index = distrib(gen);
        arr[index]++;
    }
    auto end = std::chrono::high_resolution_clock::now();

    // 计算平均访问时间
    auto duration = std::chrono::duration_cast<std::chrono::microseconds>(end - start);
    double average_time = (double)duration.count() / ITERATIONS;

    std::cout << "Average access time: " << average_time << " microseconds" << std::endl;

    // 释放内存
    #ifdef USE_HUGE_PAGES
        if (munmap(arr, ARRAY_SIZE * sizeof(int)) < 0) {
            std::cerr << "munmap failed: " << strerror(errno) << std::endl;
            return 1;
        }
    #else
        free(arr);
    #endif

    return 0;
}

编译和运行:

编译:
```
g++ -std=c++11 test.cpp -o test -lrt
```
运行 (使用大页):

确保已经预留了足够的大页，并且定义 USE_HUGE_PAGES 为 1。
```
./test
```
运行 (不使用大页):

修改代码，定义 USE_HUGE_PAGES 为 0，然后重新编译和运行。
```
g++ -std=c++11 test.cpp -o test
./test
```

通过比较使用大页和小页的平均访问时间，可以观察到大页通常能够提供更好的性能。

表格：性能对比示例 (仅供参考，实际数据取决于硬件和配置)

内存管理方式	平均访问时间 (微秒)
小页 (4KB)	1.5
大页 (2MB)	0.8

5. 实际应用场景

大页在许多高性能应用中都有广泛的应用，例如：

数据库系统： 数据库系统通常需要管理大量的内存数据，使用大页可以显著提高数据库的性能。
虚拟机： 虚拟机需要管理多个客户机的内存，使用大页可以减少虚拟机管理的开销。
科学计算： 科学计算应用通常需要处理大规模的数据集，使用大页可以提高计算速度。
深度学习： 深度学习模型通常很大，使用大页可以减少内存访问延迟，提高训练效率。
网络数据包处理： 高速网络数据包处理需要快速访问内存，大页可以提高吞吐量。

6. 选择哪种方法？

选择哪种方法取决于你的具体需求和应用场景。

mmap: 简单易用，适合大多数情况。
shmget 和 shmat: 适合多个进程共享内存的场景。
HugeTLBFS: 提供了更灵活的大页管理方式，但需要更多的配置。

7. 总结，减少TLB Miss，内存管理更有效

今天我们学习了如何在C++中使用大页来管理内存，以减少TLB Miss并提高内存访问效率。我们介绍了三种常用的方法：使用 mmap、shmget 和 shmat 系统调用，以及 HugeTLBFS 文件系统。通过合理地使用大页，我们可以显著提高应用程序的性能，特别是在处理大规模数据时。希望以上内容能够帮助大家更好地理解和应用大页技术。

更多IT精英技术系列讲座，到智猿学院

C++实现内存的大页（HugePages）管理：减少TLB Miss与提高内存访问效率

发表回复 取消回复

发表回复取消回复