`Python`的`内存`管理：`小对象`内存池与`大对象`内存分配的`策略`。 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

Python 内存管理：小对象内存池与大对象内存分配策略

大家好，今天我们来深入探讨 Python 的内存管理机制，特别是小对象内存池和大对象内存分配策略。理解这些机制对于编写高效、稳定的 Python 代码至关重要。

1. Python 的内存管理架构概览

Python 的内存管理并非完全依赖操作系统的 malloc/free。为了优化性能，Python 引入了一套自定义的内存管理系统，它建立在操作系统提供的内存分配机制之上。这套系统主要包含以下几个层次：

Level 0 (Raw Memory Allocator): 这是最底层，直接调用操作系统的 malloc/free 函数进行内存分配和释放。
Level 1 (Python Memory Allocator): 在 Level 0 的基础上，Python 实现了自己的内存管理机制，主要负责小块内存的分配和释放。这部分就是我们常说的小对象内存池，也称为 PyMem_RawMalloc 和 PyMem_RawFree 系列函数。
Level 2 (Object Allocators): 这一层面向 Python 对象（例如 int, str, list, dict 等）的分配器。每个对象类型可能都有自己专门的分配策略，但通常会利用 Level 1 提供的内存池。例如，PyObject_New 和 PyObject_Del 等宏就依赖于此。

这种分层结构允许 Python 对小对象进行更细粒度的控制，避免频繁地与操作系统交互，从而提升性能。

2. 小对象内存池 (Small Object Allocator)

小对象内存池是 Python 内存管理的核心。它的主要目标是：

减少内存碎片: 通过预先分配内存块，避免频繁地申请和释放小块内存，从而减少内存碎片。
加速内存分配: 从预分配的内存块中分配对象，比直接调用 malloc 更快。
提高内存利用率: 通过精细的内存管理，更有效地利用内存空间。

小对象内存池由多个内存池 (pool) 组成。每个内存池包含一个或多个块 (block)。每个块可以存储一个或多个相同大小的对象。

2.1 内存池 (Pool) 的结构

一个内存池通常是一个 4KB 大小的连续内存块。它包含以下几个关键部分：

pool_header: 描述内存池的状态，例如空闲块的数量、下一个可用的块等。
blocks: 实际存储对象的内存块。

可以用下面的结构体来表示一个内存池 (在实际的 CPython 源码中，结构体定义可能略有不同，但原理是相似的):

typedef struct {
    uintptr_t prevpool; /* Previous pool (used).  May be the address
                           of the arena header. */
    uintptr_t nextpool; /* Next pool (used). */
    uintptr_t freepool; /* Next pool (free).  May be NULL. */
    int         ntotalblocks;   /* Total # of blocks in pool */
    int         nfreeblocks;    /* # of free blocks in pool */
    unsigned char blocksize;      /* Size of each block in pool */
    unsigned char  pad;
    unsigned char  head;
    unsigned char  lock;        /* Mutex lock flag */
} pool_header;

其中：

prevpool 和 nextpool 用于将内存池连接成链表，方便管理。
freepool指向下一个空闲的pool，用于快速查找空闲的pool。
ntotalblocks 表示内存池中总共有多少个块。
nfreeblocks 表示内存池中还有多少个空闲块。
blocksize 表示内存池中每个块的大小。

2.2 块 (Block) 的结构

块是实际存储对象的最小单位。块的大小由对象的大小决定。例如，如果对象的大小是 8 字节，那么块的大小也是 8 字节。

当块空闲时，它会包含一个指向下一个空闲块的指针。当块被占用时，它会存储实际的对象数据。

2.3 竞技场 (Arena) 的结构

竞技场是内存池的集合。它负责管理多个内存池，并提供内存池的分配和释放功能。

一个竞技场通常包含多个内存池。当一个竞技场中的所有内存池都被用完时，会分配一个新的竞技场。当一个竞技场中的所有内存池都空闲时，该竞技场可以被释放。

typedef struct {
    uintptr_t address;      /* start address of arena */
    size_t      size;         /* total size of arena */
    uintptr_t  nextarena;     /* next arena on list of arenas */
    uintptr_t  nfreepools;    /* number of pools free in this arena */
    uintptr_t  nblocks;       /* total number of blocks in arena */
    uintptr_t  arenahash;      /* hash value of arena address */
    uintptr_t  nextavail;    /* pointer to next available block in arena */
    uintptr_t  lock;         /* mutex lock flag */
    pool_header pool_address[1]; /* Head of the list of available pools */
} arena_object;

其中：

address 和 size 表示竞技场的起始地址和大小。
nextarena 用于将竞技场连接成链表，方便管理。
nfreepools 表示竞技场中空闲的内存池数量。
nblocks 表示竞技场中总共有多少个块。
nextavail 指向竞技场中下一个可用的内存块。
pool_address 是一个 pool_header 的数组，用于管理竞技场中的内存池。

2.4 小对象内存分配过程

确定对象的大小: 首先，Python 确定需要分配的对象的大小。
查找合适的内存池: 根据对象的大小，Python 会查找一个具有合适大小块的空闲内存池。Python 维护了一个尺寸类 (size class) 的列表。每个尺寸类对应于一个特定大小的块。
分配块: 如果找到合适的内存池，Python 会从该内存池中分配一个空闲块。
更新内存池的状态: 分配块后，Python 会更新内存池的状态，例如减少空闲块的数量。
返回块的地址: Python 返回分配的块的地址给调用者。

如果找不到合适的内存池，Python 会尝试从竞技场中分配一个新的内存池。如果竞技场也用完了，Python 会分配一个新的竞技场。

2.5 小对象内存释放过程

确定对象所在的内存池: Python 根据对象的地址，确定它所在的内存池。
释放块: Python 将对象所在的块标记为空闲。
更新内存池的状态: 释放块后，Python 会更新内存池的状态，例如增加空闲块的数量。

如果一个内存池中的所有块都空闲了，该内存池可以被释放回竞技场。如果一个竞技场中的所有内存池都空闲了，该竞技场可以被释放回操作系统。

2.6 代码示例

以下是一个简化的示例，演示了小对象内存池的分配和释放过程：

import sys

# 获取小对象分配器的信息
def print_allocator_info():
    print(f"Block Sizes: {sys.getobjects(generation=0)[0].block_sizes}")
    print(f"Used Blocks: {sys.getobjects(generation=0)[0].used_blocks}")
    print(f"Free Blocks: {sys.getobjects(generation=0)[0].free_blocks}")

print("Before allocation:")
print_allocator_info()

# 分配一些小对象
a = 1
b = 2
c = 3

print("nAfter allocation:")
print_allocator_info()

# 释放对象（通过删除引用）
del a
del b
del c

print("nAfter deletion:")
print_allocator_info()

注意：sys.getobjects(generation=0)[0] 访问了 CPython 的内部结构。在不同的 Python 版本或实现中，这些结构可能不同。

分析:

这个例子中，我们创建了三个整数对象。这些整数对象通常会被分配到小对象内存池中。通过 sys.getobjects(generation=0)[0] 可以观察到 block_sizes, used_blocks, free_blocks的变化。

更详细的示例 (模拟小对象分配):

import ctypes

# 简化版的 Pool 结构 (假设 blocksize = 16)
class Pool(ctypes.Structure):
    _fields_ = [
        ("nextfree", ctypes.c_void_p),  # 指向下一个空闲块
        ("nfreeblocks", ctypes.c_int)   # 空闲块的数量
    ]

# 简化版的 Block 结构 (16 字节)
class Block(ctypes.Structure):
    _fields_ = [("data", ctypes.c_char * 16)]

# 模拟 Arena
class Arena:
    def __init__(self, size=4096):  # 4KB
        self.size = size
        self.memory = ctypes.create_string_buffer(size)
        self.pool = Pool.from_buffer(self.memory)
        self.pool.nfreeblocks = (size - ctypes.sizeof(Pool)) // ctypes.sizeof(Block)
        self.pool.nextfree = ctypes.addressof(self.memory) + ctypes.sizeof(Pool)  # 指向第一个空闲块

        # 初始化空闲块链表
        current_block_addr = self.pool.nextfree
        for _ in range(self.pool.nfreeblocks - 1):
            block = Block.from_address(current_block_addr)
            next_block_addr = current_block_addr + ctypes.sizeof(Block)
            block.data = b'' * 16 # 清空块数据
            pool_next_block = Pool.from_address(next_block_addr)
            pool_next_block.nextfree = next_block_addr
            current_block_addr = next_block_addr
        block = Block.from_address(current_block_addr) # 处理最后一个块
        block.data = b'' * 16
        pool_next_block = Pool.from_address(current_block_addr) # 处理最后一个块
        pool_next_block.nextfree = 0 # 最后一个空闲块的 nextfree 设置为 NULL

    def allocate(self):
        if self.pool.nfreeblocks > 0:
            block_addr = self.pool.nextfree
            block = Block.from_address(block_addr)

            # 更新 Pool 信息
            self.pool.nextfree = Pool.from_address(block_addr + ctypes.sizeof(Block)).nextfree
            self.pool.nfreeblocks -= 1
            return block_addr  # 返回块的地址
        else:
            return None  # 内存池已满

    def deallocate(self, addr):
        if addr:
            block = Block.from_address(addr)
            # 将释放的块插入到空闲块链表的头部

            old_nextfree = self.pool.nextfree
            self.pool.nextfree = addr
            pool_current_block = Pool.from_address(addr)
            pool_current_block.nextfree = old_nextfree

            self.pool.nfreeblocks += 1
            block.data = b'' * 16 # 清空数据

# 使用示例
arena = Arena()

# 分配三个块
block1_addr = arena.allocate()
block2_addr = arena.allocate()
block3_addr = arena.allocate()

print(f"Block 1 address: {block1_addr}")
print(f"Block 2 address: {block2_addr}")
print(f"Block 3 address: {block3_addr}")
print(f"Free blocks remaining: {arena.pool.nfreeblocks}")

# 释放第二个块
arena.deallocate(block2_addr)
print(f"Free blocks remaining after deallocation: {arena.pool.nfreeblocks}")

# 再次分配一个块，它应该使用刚刚释放的块
block4_addr = arena.allocate()
print(f"Block 4 address: {block4_addr}")
print(f"Free blocks remaining after reallocation: {arena.pool.nfreeblocks}")

注意: 这只是一个非常简化和模拟的实现，目的是为了帮助理解小对象内存池的工作原理。真正的 CPython 实现要复杂得多，包含了许多优化和错误处理机制。例如，上面的模拟代码没有处理线程安全问题，也没有考虑不同大小对象的需求。

3. 大对象内存分配

对于大于 512 字节的对象，Python 不会使用小对象内存池，而是直接调用操作系统的 malloc/free 函数进行分配和释放。这是因为：

效率: 对于大对象，内存池的优势不再明显。直接调用 malloc/free 可以避免额外的管理开销。
内存碎片: 大对象更容易导致内存碎片。直接调用 malloc/free 可以让操作系统更好地管理内存。

当分配一个大对象时，Python 会直接调用 PyMem_RawMalloc 分配内存。当释放一个大对象时，Python 会直接调用 PyMem_RawFree 释放内存。这些函数最终会调用底层的 malloc 和 free (或其他操作系统提供的内存分配函数)。

4. 内存碎片问题与应对策略

虽然 Python 内存管理试图减少内存碎片，但仍然无法完全避免。以下是一些导致内存碎片的原因：

不同大小的对象: 当分配和释放不同大小的对象时，可能会在内存中留下空洞。
长时间运行的程序: 长时间运行的程序更容易产生内存碎片。

为了缓解内存碎片问题，Python 提供了一些策略：

对象重用: Python 会尽可能地重用对象，例如字符串驻留 (string interning) 和整数缓存。
垃圾回收: Python 的垃圾回收机制会自动回收不再使用的对象，从而释放内存。
内存整理: 一些高级的垃圾回收算法可以对内存进行整理，减少内存碎片。但是，Python 默认的垃圾回收器并不具备内存整理功能。

5. Python 的垃圾回收机制

Python 的垃圾回收机制主要包括：

引用计数: 每个对象都有一个引用计数器，记录有多少个指针指向该对象。当引用计数器为 0 时，对象会被立即回收。
循环垃圾回收: 引用计数无法解决循环引用的问题（例如，两个对象互相引用）。Python 使用循环垃圾回收器来检测和回收循环引用的对象。

循环垃圾回收器会定期扫描内存中的对象，查找循环引用的对象。如果发现循环引用的对象，并且这些对象不再被其他对象引用，那么这些对象会被回收。

6. 总结与展望

Python 的内存管理机制是一个复杂而精妙的系统。通过小对象内存池和大对象直接分配，Python 实现了高效的内存利用和快速的对象分配。理解这些机制对于编写高性能的 Python 代码至关重要。

小对象使用内存池管理，减少碎片和提高分配速度。
大对象直接使用 malloc/free 分配，避免额外开销。
垃圾回收机制自动回收不再使用的对象，释放内存。

未来的 Python 内存管理可能会朝着以下方向发展：

更智能的内存池管理: 根据程序的运行模式，动态调整内存池的大小和块的大小。
更高效的垃圾回收算法: 减少垃圾回收的停顿时间，提高程序的响应速度。
内存整理: 引入内存整理功能，进一步减少内存碎片。