PHP 架构推论：假如 PHP 核心抛弃引用计数全面转向分代回收，现有的 Zend 引擎需做哪些物理变迁？ - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

女士们，先生们，各位 PHP 爱好者，欢迎来到今晚的讲座。如果你觉得 PHP 代码写得有点像在拼积木，觉得 unset 的时候那声“咔哒”清脆悦耳，觉得引用计数就是互联网世界的上帝之手，那么今晚，请暂时忘掉这些美好的幻想。

我们要来聊一聊一个“地狱级”的假设：假如 PHP 核心彻底抛弃引用计数，转而拥抱分代回收机制。

想象一下，Zend 引擎不再使用“每个对象都有个保镖（引用计数）”的战术，而是决定采用“把垃圾集中扔进大桶，周末统一清运”的策略。这不仅仅是换个 GC 算法的问题，这相当于要把 PHP 引擎的骨架拆了重拼。

来，把你们的口水擦一擦，我们要开始动手术了。这可是硬核的架构物理变迁。

第一部分：ZVAL 的“断奶”与“整容”

在旧架构里，ZVAL（Zend Value）是 PHP 世界的最小原子单位。它就像一个多功能手电筒，既能当灯泡（字符串），又能当电池（整数），还能当遥控器（对象句柄）。

// [旧架构] zend_value 结构体
typedef union _zend_value {
    zend_long lval;             // 长整型
    double dval;                // 浮点型
    zend_refcounted *counted;   // 指向引用计数的对象
    zend_string *str;           // 字符串
    zend_array *arr;            // 数组
    zend_object *obj;           // 对象
    zend_resource *res;         // 资源
    zend_reference *ref;        // 引用
    void *ptr;                  // 指针
    zend_class_entry *ce;       // 类入口
    zend_function *func;        // 函数
    struct {
        uint32_t type:4;
        uint32_t v:28;
    } type_info;
} zend_value;

在这个结构里，虽然大部分字段看起来是备胎，但 counted 指针可是核心。更重要的是，ZVAL 内部通常还有一个 u2 字段，专门用来存引用计数。

物理变迁 1：ZVAL 变成“句柄”

抛弃引用计数后，ZVAL 不再持有指向对象的直接指针，也不再有 refcount。

// [新架构] zend_gc_handle 结构体（假设的）
typedef struct _zend_gc_handle {
    void *ptr;                  // 指向堆上真正的对象（可能是对象、数组、字符串）
    uint8_t generation;         // 分代标记：0=新生代, 1=老年代
    uint8_t flags;              // 特殊标记
} zend_gc_handle;

// [新架构] zend_value 结构体
typedef union _zend_value {
    zend_gc_handle handle;      // 统一变成句柄
    // ... 其他原始类型字段保留，如 lval, dval
    struct {
        uint32_t type:4;
        uint32_t v:28;
    } type_info;
} zend_value;

你看，变化多巨大。以前 lval 和 handle 是互斥的，现在 handle 拿了优先权。这意味着什么呢？

意味着 内存布局的重组。以前，为了节省内存，ZVAL 对齐到 8 字节，且紧凑排列。现在，zend_gc_handle 作为一个 64 位指针，不仅占满了空间，还引入了“分代”的概念。这意味着每一个 ZVAL 都要携带“它住哪个小区（分代）”的信息。

这不仅仅是结构体的变化，这会让 ZVAL 在 CPU 缓存行（Cache Line）里的表现变得极其“暴躁”。你本来只是想存个整数，结果它强行塞给你 64 位的句柄，虽然你只用了低 32 位。这就像你买了个超大的行李箱，结果只装了一只袜子。

第二部分：`zend_object` 结构体的“断臂求生”

对象是 PHP 里最重头戏的数据。在旧架构里，zend_object 结构体里有个 gc 成员，其实就是引用计数。

// [旧架构] zend_object
typedef struct _zend_object {
    zend_class_entry *ce;       // 类
    const zend_object_handlers *handlers; // 处理函数
    zend_object *properties;    // 属性
    HashTable *std_properties;  // 标准属性表
    // ...
    zend_refcounted gc;         // 引用计数实体
} zend_object;

物理变迁 2：对象头部的消失与句柄化

为了支持分代 GC，我们不能再依赖 zend_refcounted 这种轻量级结构了。我们需要给每一个堆上的对象加个“身份证”。

// [新架构] zend_gc_object（假设的，通常会是内嵌在 zend_object 里）
typedef struct _zend_gc_object {
    zend_gc_handle handle;      // 它自己的句柄
    // 分代 GC 需要记录它在哪个代
} zend_gc_object;

// [新架构] zend_object
typedef struct _zend_object {
    zend_class_entry *ce;
    const zend_object_handlers *handlers;
    // ...
    zend_gc_object gc;          // 内嵌的 GC 头部
} zend_object;

但是等等，这里有个巨大的矛盾。如果 zend_object 结构体变大了，那继承的开销就太大了。PHP 的类继承太丰富了，如果每个对象都多带一个 64 字节的对象头，内存消耗将是一个天文数字。

所以，物理变迁的代价是：ZVAL 将真正承担起“指向堆”的重任。在旧架构里，ZVAL 指向 zend_value，zend_value 指向 zend_refcounted（即对象）。在新架构里，ZVAL 直接指向堆上的内存块（不管是对象、数组还是字符串），这内存布局会变得更加线性，但间接寻址会变多。

第三部分：执行器与 `&` 符号的血泪史

这可能是对 PHP 代码生态冲击最大的地方。在旧架构里，$a = &$b 意味着 $a 和 $b 指向同一块内存，而且这块内存的 refcount 会变成 2。这是一个 O(1) 的原子操作。

在分代 GC 下，& 引用发生了质变。

物理变迁 3：引用不再是指针，而是“双重句柄”

在旧世界，ZVAL 里的 ref 字段指向一个 zend_reference 结构，这个结构又指向实际的值。现在，我们抛弃了这个中间商。

// [新架构] 引用类型的物理实现
typedef struct _zend_reference {
    zend_gc_handle ref;         // 引用自身的句柄
    zend_gc_handle val_handle;  // 指向实际值的句柄（可能是对象，可能是数组）
    uint32_t u1;                // 内部标志
} zend_reference;

代码示例：迁移的痛苦

想象一下，现在的 PHP 代码：

<?php
function append(&$array, $value) {
    $array[] = $value;
}
$a = [1, 2];
append($a, 3); // 引用传递

在旧架构下，append 函数接收的是一个 zval* 指针，操作极其简单。但在新架构下，append 接收的仅仅是 zval（句柄）。

// [旧架构] append 函数实现
void ZEND_FASTCALL append(zval *ref_array, zval *value) {
    // 直接操作指针，因为是引用，refcount 已经是 2 了
    arr = Z_ARRVAL_P(ref_array); 
    add_next_index_zval(arr, value);
}

在新架构下，我们需要显式地获取引用的值句柄：

// [新架构] append 函数实现（伪代码）
void ZEND_FASTCALL append(zval *ref_array, zval *value) {
    // 1. 必须检查 ref_array 是否是引用类型
    if (Z_TYPE_P(ref_array) == IS_REFERENCE) {
        // 2. 解引用：获取引用指向的值句柄
        zend_reference *ref = Z_REF_P(ref_array);
        HashTable *arr = (HashTable *)GC_HANDLE_TO_PTR(ref->val_handle);
        // 3. 操作数组
        add_next_index_zval(arr, value);
    } else {
        // 如果不是引用，PHP 可能会自动 copy-on-write（COW），这可是性能杀手
        // 或者抛出异常，要求显式使用 & 操作符
        zend_error(E_ERROR, "Reference required for array mutation");
    }
}

这对解析器的影响是巨大的。所有的 OPCode（操作码）都需要检查 & 修饰符。如果用户忘了写 &，性能会下降（因为需要 copy 数组到堆上），或者报错。这种“显式优于隐式”的转变，会让现有的 PHP 生态瞬间卡顿 20%。

第四部分：分代堆的物理重组与内存碎片

引用计数之所以快，是因为它是即时的。对象死了一秒就没了。分代 GC 是即时的吗？不，它分代。新生代满了才触发。

这意味着 Zend Engine 需要一个全新的内存分配器。

物理变迁 4：三色标记法与写屏障

我们需要维护三个队列：白色（待回收）、灰色（待扫描）、黑色（已扫描）。

// [新架构] 分代 GC 核心结构
typedef struct _zend_gc_heap {
    zend_gc_handle *eden_gen;       // 新生代数组
    size_t eden_size;
    size_t eden_capacity;

    zend_gc_handle *old_gen;        // 老年代数组
    size_t old_size;
    size_t old_capacity;

    zend_gc_handle *gray_stack;     // 灰色对象栈
    size_t gray_size;
    size_t gray_capacity;

    zend_gc_handle *white_list;     // 待回收白名单
    size_t white_size;
    size_t white_capacity;

    // 写屏障：当引用更新时触发
    void (*write_barrier)(void *ptr1, void *ptr2);
} zend_gc_heap;

物理变迁 5：写时复制 (COW) 的重构

在引用计数时代，COW 是通过增加 refcount 实现的。现在 refcount 没了，COW 怎么办？

如果你在旧世界里写 $a = [1,2]; $b = $a;，PHP 只是复制了 ZVAL 的头部（引用计数变成2），并没有复制数组内容。

在新世界里，这必须变成深拷贝（至少是浅拷贝数组结构）。

// [新架构] 赋值操作
void zval_assign(zval *dest, zval *src) {
    if (Z_TYPE_P(src) == IS_ARRAY) {
        // 新架构：如果是数组，必须深拷贝结构，因为它是堆上的
        HashTable *new_arr = zend_hash_copy(Z_ARRVAL_P(src));
        ZVAL_PTR(dest, (void*)new_arr);
    } else {
        // 原始类型直接赋值
        ZVAL_COPY_VALUE(dest, src);
    }
}

这会导致 PHP 的赋值操作变得非常重。你写 $c = $a，以前是 O(1)，现在可能是 O(N)，因为可能触发了数组的结构复制。这简直是性能的噩梦，除非我们引入 Copy-on-Write 的变体：Write-on-Reference。即只有当你修改数组时，才真正分配新内存。

第五部分：GC 的“暂停时间”与 CPU 缓存

引用计数是单线程的（ZTS 下也只是原子操作），它不会暂停。分代 GC 是多线程的，它需要扫描。

物理变迁 6：全局停顿

为了防止 GC 线程和执行线程并发修改对象状态导致数据不一致，我们需要“Stop-The-World”。

// [新架构] GC 触发循环
void gc_collect_cycles() {
    TSRMLS_FETCH();

    // 1. 停止世界：挂起所有用户线程
    // 这个钩子函数会插入到 OPCode 的执行循环中
    zend_interrupt_check();

    // 2. 标记阶段：将所有根集（局部变量、全局变量、超全局变量）设为灰色
    mark_root_set();

    // 3. 扫描阶段：遍历灰色对象，将其子节点设为灰色
    while (!is_gray_empty()) {
        scan_and_gray_children();
    }

    // 4. 清除阶段：将所有白色对象回收
    sweep_dead_objects();

    // 5. 恢复世界
    // ...
}

这就像你做饭的时候，突然把你按在椅子上，直到你把盘子都洗完。对于 Web 服务器来说，这 50ms 的暂停可能意味着 10 个 PHP 请求直接超时。

此外，为了适应分代 GC，我们需要引入 写屏障。

在旧架构里，zval_ptr_dtor 仅仅是减少一个计数器。在新架构里，如果一个黑色对象引用了白色对象，我们需要把那个白色对象标记为灰色。

// [新架构] 写屏障伪代码
void zval_ptr_write_dtor(zval *zv, zval *new_zv) {
    // ... 写入新值 ...

    // 假设现在黑色对象 zv 引用了 new_zv
    if (is_black(Z_OBJ_P(zv)) && is_white(Z_OBJ_P(new_zv))) {
        make_gray(Z_OBJ_P(new_zv)); // 把它抓起来扫描
    }
}

这意味着每一行赋值代码，在底层 C 代码里，都要额外执行一个 if 判断。这在 PHP 这种解释型语言中是巨大的性能损耗。

第六部分：数组和字符串的“去中心化”

对象有 zend_object，数组呢？数组也是引用计数。字符串也是。

如果全面分代回收，ZVAL 不再直接指向对象，而是指向一个“句柄”。那么这个句柄指向什么？指向堆。

物理变迁 7：统一内存管理器

以前，对象、数组、字符串各自为政，它们都有一个独立的 refcount。现在，它们都需要一个“大管家”。

// [新架构] 堆内存分配块头部
typedef struct _zend_gc_block {
    size_t size;                 // 块大小
    uint8_t color;               // 三色：WHITE, GRAY, BLACK
    uint8_t gen;                 // 分代：0, 1, 2
    uint8_t type;                // 类型：OBJECT, ARRAY, STRING
    struct _zend_gc_block *next; // 链表指针（用于快速遍历）
} zend_gc_block;

所有的对象、数组、字符串在堆上的头部，都必须包含这个 zend_gc_block。

这意味着，以前 PHP 中 $arr = [] 只是在栈上分配了一个 HashTable 结构（很小）。现在，它必须在堆上分配一个 zend_gc_block + HashTable 结构。

// [新架构] 创建空数组
zend_array *zend_new_array(uint32_t size) {
    // 1. 在堆上申请内存：block header + array body
    zend_gc_block *block = (zend_gc_block *)emalloc(sizeof(zend_gc_block) + sizeof(HashTable));
    block->gen = 0; // 新生代
    block->color = WHITE;
    block->type = TYPE_ARRAY;

    HashTable *ht = (HashTable *)(block + 1);
    ht->nNumUsed = ht->nNumSize = 0;
    ht->nInternalFlag = HASH_FLAG_INITIALIZED;

    // 2. 返回指向数组的指针（实际上是指向 block 后面）
    return ht;
}

这导致 PHP 的内存开销显著增加。而且，ZVAL 的对齐方式也要重新设计。以前 ZVAL 是 8 字节对齐，现在由于 ZVAL 指向的堆对象可能很大（比如大字符串），ZVAL 可能需要 16 字节对齐，或者 ZVAL 本身变成 16 字节宽（64位系统），但这会挤占类型信息的空间。

第七部分：资源与关闭函数

资源（如 mysqli、fopen）是 PHP 的遗留物。在旧架构里，资源的引用计数为 0 时，会自动调用 close 函数。这是自动化的。

物理变迁 8：资源管理的异步化

在分代 GC 下，资源的生命周期不再由引用计数决定，而是由 GC 决定。这意味着我们不能在 refcount == 0 时立刻释放资源，因为这可能导致资源句柄在 GC 回收之前被外部（如 C 扩展）访问。

我们需要引入弱引用或者引用标记的概念。

// [新架构] 资源结构体
typedef struct _zend_resource {
    zend_gc_block gc;            // GC 头部
    int type;                    // 资源类型
    void *ptr;                   // 资源指针
    int refcount;                // 引用计数（可能保留作为软引用，或者完全移除）

    // 延迟关闭队列
    struct _zend_resource *closed_list;
} zend_resource;

当 GC 发现一个资源是“可回收”的，它不能马上 efree。它必须把这个资源扔进一个“待关闭列表”。当 PHP 请求真正结束时，或者执行到一个安全的“垃圾收集点”，PHP 才会遍历这个列表，依次调用扩展提供的关闭函数。

这会增加请求结束时的处理延迟。

总结

我们经历了 PHP 架构的“脱胎换骨”。

ZVAL 变成了句柄：内存布局改变，引入分代信息。
堆头部加重：每个对象、数组、字符串头都要带 GC Block。
引用语义剧变：& 操作符不再意味着共享，而是意味着“我要一个特殊的引用句柄”。
写屏障引入：每次赋值都要检查是否要触发标记。
Stop-The-World：GC 有了暂停时间，可能影响 Web 服务器响应。
资源延迟释放：关闭函数不再是即时的。

如果 PHP 真的这么做，它将失去引用计数那种“秒级响应”的极致性能，换来的是处理循环引用的能力和更高的内存占用。从物理层面看，这就像把一辆轻便的摩托车（引用计数版 PHP）拆了，换成了一个带防撞气囊、备胎和导航系统，但油耗极高的重型坦克（分代 GC 版 PHP）。

但话说回来，如果 PHP 能解决并发下的 GC 问题，或许这也是一条通往更高性能（处理更多对象）的道路。只是今晚，我们恐怕得忍受更多的 CPU 开销和更复杂的内存分配逻辑了。

好了，讲座结束，下课！

第一部分：ZVAL 的“断奶”与“整容”

第二部分：zend_object 结构体的“断臂求生”

第三部分：执行器与 & 符号的血泪史