JIT 编译器的‘去虚化’（Devirtualization）：将动态类方法调用转化为物理地址直接跳转 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

好，各位听众，把你们的咖啡放下，把刚才关于“周一综合征”的抱怨收起来。坐直了。今天我们要聊的，是编程世界里一场关于“速度”的暗战，是一场在微秒之间展开的博弈。

想象一下，你的 CPU 是一个超级强壮的大力士，他每秒钟能挥拳几百次，每一次挥拳都要经过大脑（指令集）的授权。现在，你有一项任务：去敲隔壁老王家的门，让他出来喝酒。

最慢的方法是什么？不是你直接跑过去，而是你写了一张纸条，写上“请老王出来”，然后把这纸条塞进一个信封，把这个信封交给邮差，让邮差去老王家，再让老王拆信。这叫“虚化”调用。你需要经历：查表（找邮局）-> 传递 -> 拆信 -> 猜地址（找到人）-> 敲门。

而我们今天要讲的 JIT 编译器的“去虚化”，就是要把那张纸条揉成一团扔掉，我们直接冲到老王家门口，在那块地上刻下他的门牌号，然后大喊一声：“老王，出来！”

这就是去虚化。它能把“动态调用”变成“直接跳转”。

一、虚函数的罪与罚：那个慢吞吞的信封

我们先来聊聊为什么要搞这个“去虚化”。在很多语言里，比如 C++，我们喜欢用 virtual 关键字。这很方便，你定义了一个基类 Animal，然后派生出 Dog 和 Cat。你想让所有动物都会叫。

class Animal {
public:
    virtual void speak() { std::cout << "Some sound"; }
};

class Dog : public Animal {
public:
    void speak() override { std::cout << "Woof!"; }
};

class Cat : public Animal {
public:
    void speak() override { std::cout << "Meow!"; }
};

当你这样写代码时，程序运行起来是这样的：

你手里拿着一个指向 Animal 的指针。
你说：“喂，你是个动物，叫一声。”
程序不知道你是 Dog 还是 Cat，所以它必须去查表。每个对象里都有一个隐藏的 vptr 指针，指向一张虚函数表。
它顺着 vptr 找到那张表，在表里找到 speak 的索引（比如索引是0）。
它拿着这个索引去读表里第0个位置的内存地址。
它跳转到那个地址，执行 Dog::speak 或者 Cat::speak。

这很慢，真的。 为什么？因为这是间接跳转。
CPU 有流水线。当你执行 call [address] 时，CPU 不知道下一个指令在哪儿。它得停下来，去内存里读那个地址，然后才能准备好下一条指令。这中间的空隙，就被浪费了。而且，现代 CPU 有分支预测器，但在处理这种“间接跳转”时，预测器的准确率往往只有 50% 左右。这意味着，大概率你会猜错，CPU 不得不清空流水线，白白浪费几十个周期。

所以，当我们把 Animal* a = new Dog(); a->speak(); 写进代码时，我们就在 CPU 的血管里埋下了一颗定时炸弹，一颗名为“性能瓶颈”的定时炸弹。

二、 JIT 编译器：那个偷懒又聪明的魔法师

这时候，JIT（Just-In-Time）编译器登场了。

JIT 编译器是运行时环境的杀手锏。它像是一个极其狡猾的占星师。当你写代码时，解释器（或者即时编译器）在旁边看着你。它不想让你每次都慢吞吞地查表，它想变成机器码。

它的逻辑通常是：“既然你在循环里，既然你一直在调用这个方法，那我就赌一把：这一刻，你就是 Dog。”

于是，JIT 开始干活。它看到 a->speak()，它觉得这个调用太频繁了，而且它观察了之前的几百次调用，发现 a 永远都是 Dog。

这时候，去虚化就开始了。

三、守卫：带安全带的激进跳跃

直接跳转虽然爽，但如果不小心，就会炸。万一 a 突然变成了 Cat 怎么办？直接跳转会去执行 Dog::speak，这会导致程序崩溃或者逻辑错误。

所以，JIT 不能一上来就直接跳。它得像个精明的保镖，带个“守卫”。

它的策略是这样的：

在跳转到 Dog::speak 之前，先检查一下 a 的 vptr。
看看这个 vptr 指向的虚表，是不是真的指向 Dog 的虚表。
如果是，嘿嘿，跳转！
如果不是（守卫失效），怎么办？赶紧撤退！回到慢速的解释器模式，或者重新编译一段新代码。

这就像是你直接冲到老王家门口，但你手里拿着一把钥匙，你必须先试一下是不是老王的钥匙。如果试对了，你进去；如果试错了，你被保安按在地上。

这种带守卫的跳转，在编译器界有个好听的名字：Indirect Branch Target Misprediction Recovery（间接分支目标错误恢复）。

四、代码演示：从慢到快的奇迹

让我们通过伪代码来看看这种变化。

1. 慢速模式（解释器 / C1 编译器）

; 假设 a 是栈上的局部变量，或者指向堆的指针
mov     rax, [rbp - 8]       ; 1. 把对象指针 a 拉出来
mov     rax, [rax]          ; 2. 去内存找 vptr（查表） - 这是最慢的一步
mov     rax, [rax + 16]     ; 3. 假设 speak 在 vtable 的第2个位置 (偏移16)
call    qword ptr [rax]     ; 4. 间接调用

你看这四行代码，每一步都可能命中缓存，但每一步都增加了延迟。特别是在第2步，如果不命中缓存，那简直就是灾难。

2. 快速模式（JIT 去虚化）

假设 JIT 确信 a 就是 Dog，并且 Dog::speak 就在内存地址 0x00405000 处。

; JIT 生成的代码
mov     rax, [rbp - 8]       ; 1. 依然是取指针，但这一步很快，因为指针可能还在寄存器里
mov     r11, qword ptr [rax] ; 2. 读 vptr (为了守卫，必须读一次)
cmp     r11, 0x1000         ; 3. 守卫！检查 vptr 是否等于 Dog 的虚表地址
jne     SlowPath             ; 4. 如果不对，去慢速路径
jmp     Dog_speak            ; 5. 对了！直接跳转！这比 call 指令更快，因为不需要压栈和压入返回地址！

Dog_speak:
    ; ... Dog::speak 的具体实现 ...
    ; 甚至可能直接把 Dog::speak 的代码内联到这里，省去了 call 指令的开销

差异在哪？
最核心的差异在第 5 步。jmp 是无条件跳转，它是 CPU 流水线最喜欢的指令，因为它非常快，而且 CPU 可以直接预测。它不需要再去内存里读下一个指令地址。

五、单态与多态：赌徒的胜利

去虚化之所以能成功，关键在于“频率”和“模式”。

单态

这是最简单的情况。你的代码是这样的：

# 伪代码
for i in range(1000000):
    dog = Dog()
    dog.speak() # 这里，dog 永远是 Dog

JIT 编译器看到这里，一看：“好家伙，循环一百万次，全是 Dog。”
它编译出的代码就是纯粹的直接跳转。这叫单态。这是去虚化的圣杯。

多态

现在情况变了：

# 伪代码
for i in range(1000000):
    animal = random_animal() # 有 50% 概率是 Dog，50% 概率是 Cat
    animal.speak()

JIT 编译器一看：“卧槽，又 Dog 又 Cat？”
它就麻烦了。它不能直接编译成只跳转 Dog 的代码，因为它不知道这次调用的是谁。它会放弃去虚化，继续使用“查表”的方式。
这叫多态。在多态面前，JIT 编译器只能选择保守，这就是性能的杀手。

超态

如果代码里混杂了 Dog, Cat, Bird, 甚至 Elephant 呢？那就叫超态。这时候，去虚化基本不可能，因为每次调用的类型都不一样，查表都来不及。

所以，JIT 编译器的去虚化技术，本质上是一种类型推断技术。它试图从大量的运行时数据中，推断出“这个指针大概率是这玩意儿”。

六、逃逸分析：把堆扔进栈里

去虚化的另一个大杀器，叫做逃逸分析。

还记得 vptr 吗？vptr 是存在于堆上的。为什么？因为对象很大，或者生命周期很长。
但如果对象很小，而且从来没传给其他函数，也没传给其他线程呢？JIT 编译器会说：“哼，这玩意儿我给你搬到栈上去！”

这就是逃逸分析。如果 a 没有逃逸，它就是一个栈上的变量。

void test() {
    Dog d; // 没有传给外部
    d.speak();
}

在这个函数里，d 是在栈上的。既然在栈上，它就没有 vptr（因为虚函数表指针是堆分配特有的，用于多态支持）。
JIT 编译器会直接把 d.speak() 转换成 Dog::speak(&d)。
这直接消灭了 vptr 的查找。连“信封”都不需要了，直接把信塞进狗嘴里！

七、内联缓存：记性好的邮差

JIT 编译器不仅聪明，它还记性好。这就是 内联缓存。

当你第一次调用 a->speak() 时，JIT 可能还不敢完全确定，它可能走了慢速路径，或者带守卫的快速路径。
但是，一旦守卫通过，JIT 会把这个结果记下来。
“嘿，上次这个 a 指针，调用的是 Dog::speak，地址是 0x1234。”

下一次调用时，JIT 不需要再读 vptr 了。它直接去读它上次记下来的那个地址。
这就是 基于内联缓存的去虚化。

它在寄存器里维护一个 Cache。如果类型匹配，命中率极高。如果类型不匹配，它就触发 Deoptimization（反优化），回退到解释器或重新编译。

八、汇编层面的极致优化：VTable 内联

最极限的去虚化是什么？是VTable 内联。

如果你的程序里，Animal 的子类虽然多，但是你在某一段特定的代码里，a 要么全是 Dog，要么全是 Cat，其他子类根本不进这个函数。

JIT 编译器会作弊。它会把 Dog::speak 的机器码直接复制粘贴到调用者的代码里。它不再跳转，而是直接把狗叫的那段代码“抄”下来，放在那。

这样，就没有调用开销，没有表查找，没有守卫检查。这段代码就像手写的普通函数一样快。

九、现实世界的应用：Java HotSpot 与 LLVM

我们来看看这些大厂是怎么玩这个的。

在 Java HotSpot JVM 中，如果你看到一个类加载器加载了 Foo 和 Foo$1，JIT 编译器会认为这俩家伙是一伙的，属于同一个类型系统。在调用 foo.method() 时，它会尝试去虚化。

在 LLVM（编译器基础设施）里，也有类似的技术。当你写 C++ 并开启 -O3 优化时，编译器会拼命分析你的代码。如果你只把 Base 指针传给函数 func，但函数内部 if (ptr->isDerived()) 一直走 Derived 分支，编译器可能会在 func 内部直接把 ptr 当作 Derived 来用，从而消除虚函数调用。

十、懒惰的程序员与勤奋的编译器

写代码的时候，我们总是想偷懒。我们喜欢多态，喜欢扩展性。我们不知道运行时会发生什么。
但是，JIT 编译器就像是那个勤奋的秘书。它在背后默默观察你的一举一动。

它不逼你把代码重写成 if/else 链。它只是看着你，一旦它发现你这种写法运行得非常频繁，而且模式非常固定，它就会默默地把你的“多态”变成“静态”。

这就是去虚化的精髓：在运行时动态地实现编译时的优化。

十一、去虚化的陷阱与艺术

当然，这也不是没有代价的。

代码膨胀：如果你有很多种类型，JIT 为了去虚化，可能会为每种类型生成一份特定的机器码。如果你的代码库有几百个子类，JIT 可能会为了那一小段“热门代码”而生成几百份副本。这叫代码膨胀。
编译时间：编译器变得更聪明了，分析逻辑更复杂了，这会消耗更多的 CPU 时间来编译你的代码。
内存占用：因为代码膨胀，生成的机器码可能比纯解释器代码大很多。

所以，JIT 编译器是一个权衡大师。它必须在“编译慢”、“内存大”和“运行快”之间找到平衡。

十二、总结：告别信封，拥抱裸奔

回到我们的老王故事。

去虚化技术，就是那个把“信封”扔掉，直接冲向老王的技术。
JIT 编译器是那个不断观察你、分析你、最后决定“我看透你了，你就是个狗叫”的算命先生。

通过守卫、逃逸分析、内联缓存，JIT 编译器把动态语言的灵活性，硬生生地榨出了静态语言的速度。

下次当你看到你的代码运行飞快时，不要以为那是你写得好。那是 JIT 编译器在你看不到的地方，替你把那个慢吞吞的信封拆了，把里面的纸条揉烂，然后直接冲进了老王家的大门。

这就是去虚化。它不是魔法，它是算法对现实世界的极致模仿。

好了，今天的讲座就到这里。希望大家在写代码时，能感受到背后那双无形的手——编译器之手，正为你加速，为你破壁。

现在，让我们去把那些 virtual 关键字都找出来，看看能不能让编译器更开心一点。

（全剧终，掌声）

一、 虚函数的罪与罚：那个慢吞吞的信封

二、 JIT 编译器：那个偷懒又聪明的魔法师

三、 守卫：带安全带的激进跳跃

四、 代码演示：从慢到快的奇迹

1. 慢速模式（解释器 / C1 编译器）

2. 快速模式（JIT 去虚化）

五、 单态与多态：赌徒的胜利

单态

多态

超态

六、 逃逸分析：把堆扔进栈里

七、 内联缓存：记性好的邮差

八、 汇编层面的极致优化：VTable 内联

九、 现实世界的应用：Java HotSpot 与 LLVM

十、 懒惰的程序员与勤奋的编译器

十一、 去虚化的陷阱与艺术

十二、 总结：告别信封，拥抱裸奔

发表回复 取消回复