JS `Type Feedback`：V8 如何收集类型信息以进行优化 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

咳咳，各位观众老爷们，大家好！今天咱们来聊聊 V8 引擎里一个非常有趣，但又有点神秘的东西：Type Feedback，也就是类型反馈。

啥是 Type Feedback？

说白了，Type Feedback 就是 V8 收集 JavaScript 代码中变量、属性、函数调用等地方的类型信息的过程。想象一下，V8 就像一个侦探，在你运行代码的时候，它偷偷地观察，记录每个变量都存了什么类型的值，函数调用的时候传了什么类型的参数。

为啥要收集类型信息？

JavaScript 是一门动态类型语言，这意味着变量的类型是在运行时决定的，而不是在编译时。这给 V8 带来了很大的挑战。如果 V8 不知道一个变量是什么类型，它就不得不做很多额外的检查，这会严重影响性能。

有了 Type Feedback，V8 就能知道变量的类型，然后就可以做各种优化，比如：

内联缓存 (Inline Caches, ICs): 这是 Type Feedback 最重要的应用之一。ICs 可以缓存属性查找的结果，避免每次都进行完整的属性查找过程。
类型特化 (Type Specialization): V8 可以根据类型信息，生成针对特定类型的优化代码。
去优化 (Deoptimization): 如果 Type Feedback 发现类型信息发生了变化，V8 可能会放弃之前的优化，回到更慢但更通用的代码版本。

Type Feedback 的工作原理

Type Feedback 的工作原理大致可以分为以下几个步骤：

第一次执行： 当 V8 第一次执行一段代码时，它会假设所有变量的类型都是未知的。
收集信息： 在代码执行过程中，V8 会记录变量、属性、函数调用等地方的类型信息。这些信息会被存储在隐藏类 (Hidden Classes) 和反馈向量 (Feedback Vectors) 中。
更新信息： 随着代码的执行，V8 会不断地更新类型信息。如果类型信息发生了变化，V8 可能会进行去优化。
优化代码： V8 会利用收集到的类型信息，对代码进行优化。比如，它可以根据类型信息，生成针对特定类型的机器码。

隐藏类 (Hidden Classes)

隐藏类是 V8 用来描述对象结构的一种内部数据结构。它可以用来快速查找对象的属性。

想象一下，你有一堆 JavaScript 对象，它们都有一些属性，比如 name 和 age。如果 V8 不使用隐藏类，它就不得不每次都遍历对象的属性列表，才能找到 name 和 age 属性。

有了隐藏类，V8 就可以把所有具有相同属性结构的对象，都归到同一个隐藏类下面。这样，V8 只需要查找一次隐藏类，就能知道 name 和 age 属性在对象中的位置。

function Point(x, y) {
  this.x = x;
  this.y = y;
}

const p1 = new Point(1, 2);
const p2 = new Point(3, 4);

// p1 和 p2 具有相同的属性结构，它们会被归到同一个隐藏类下面。

反馈向量 (Feedback Vectors)

反馈向量是 V8 用来存储类型信息的一种数据结构。它包含了变量、属性、函数调用等地方的类型信息。

反馈向量可以存储多种类型的信息，比如：

变量的类型： 比如，变量是一个整数、一个字符串、还是一个对象。
属性的类型： 比如，对象的 name 属性是一个字符串，age 属性是一个整数。
函数调用的参数类型： 比如，函数 add(a, b) 的参数 a 和 b 都是整数。
函数的返回值类型： 比如，函数 add(a, b) 的返回值是一个整数。

内联缓存 (Inline Caches, ICs)

内联缓存是 Type Feedback 最重要的应用之一。它可以缓存属性查找的结果，避免每次都进行完整的属性查找过程。

想象一下，你有一段代码，需要多次访问同一个对象的 name 属性。如果 V8 不使用内联缓存，它就不得不每次都进行完整的属性查找过程。这会非常耗时。

有了内联缓存，V8 就可以把第一次属性查找的结果缓存起来。以后再访问同一个对象的 name 属性时，V8 就可以直接从缓存中读取结果，而不需要再次进行属性查找。

function getName(obj) {
  return obj.name; // 第一次访问 obj.name 时，V8 会创建一个内联缓存。
}

const person = { name: "Alice", age: 30 };

getName(person); // 第一次调用 getName 时，V8 会进行属性查找，并将结果缓存到内联缓存中。
getName(person); // 第二次调用 getName 时，V8 会直接从内联缓存中读取结果，而不需要再次进行属性查找。

内联缓存可以分为以下几种类型：

单态 (Monomorphic): 只有一个类型的内联缓存。这是最理想的情况。
多态 (Polymorphic): 有多个类型的内联缓存。这种情况比单态要慢一些。
巨态 (Megamorphic): 有很多类型的内联缓存。这种情况最慢。

V8 会尽量把内联缓存优化成单态的。如果内联缓存变成了多态或巨态的，V8 可能会进行去优化。

类型特化 (Type Specialization)

类型特化是 V8 根据类型信息，生成针对特定类型的优化代码的过程。

想象一下，你有一个函数 add(a, b)，它可以接受两个参数 a 和 b。如果 V8 知道 a 和 b 都是整数，它就可以生成针对整数的优化代码。比如，它可以使用整数加法指令，而不是通用的加法指令。

function add(a, b) {
  return a + b;
}

add(1, 2); // 如果 V8 知道 a 和 b 都是整数，它就可以生成针对整数的优化代码。

类型特化可以显著提高代码的性能。

去优化 (Deoptimization)

去优化是 V8 放弃之前的优化，回到更慢但更通用的代码版本的过程。

当 Type Feedback 发现类型信息发生了变化时，V8 可能会进行去优化。比如，如果 V8 之前假设一个变量是一个整数，但后来发现它变成了一个字符串，V8 就可能会放弃之前的优化，回到更慢但更通用的代码版本。

去优化是一个代价很高的操作，因为它会使代码的性能下降。因此，V8 会尽量避免去优化。

代码示例

下面是一些代码示例，可以帮助你更好地理解 Type Feedback 的工作原理。

// 示例 1：单态内联缓存

function getName(obj) {
  return obj.name;
}

const person1 = { name: "Alice", age: 30 };
const person2 = { name: "Bob", age: 40 };

getName(person1); // 第一次调用 getName 时，V8 会创建一个单态内联缓存，缓存 person1.name 的结果。
getName(person2); // 第二次调用 getName 时，V8 会直接从单态内联缓存中读取结果，而不需要再次进行属性查找。

// 示例 2：多态内联缓存

function getProperty(obj, key) {
  return obj[key];
}

const person = { name: "Alice", age: 30 };
const address = { city: "Beijing", country: "China" };

getProperty(person, "name"); // 第一次调用 getProperty 时，V8 会创建一个内联缓存，缓存 person.name 的结果。
getProperty(address, "city"); // 第二次调用 getProperty 时，V8 会发现 key 的类型发生了变化，因此会把内联缓存升级为多态内联缓存。

// 示例 3：类型特化

function add(a, b) {
  return a + b;
}

add(1, 2); // 第一次调用 add 时，V8 会发现 a 和 b 都是整数，因此会生成针对整数的优化代码。
add(3.14, 2.71); // 第二次调用 add 时，V8 会发现 a 和 b 都是浮点数，因此会生成针对浮点数的优化代码。

如何编写 Type Feedback 友好的代码

为了让 V8 更好地优化你的代码，你应该尽量编写 Type Feedback 友好的代码。这意味着你应该：

避免类型转换： 尽量避免在运行时进行类型转换。类型转换会导致 V8 无法确定变量的类型，从而影响性能。
保持类型一致： 尽量保持变量的类型一致。如果一个变量的类型经常变化，V8 可能会进行去优化。
使用字面量： 尽量使用字面量来创建对象和数组。字面量可以帮助 V8 更好地推断对象的结构。
避免使用 eval 和 with： eval 和 with 会使 V8 无法确定变量的类型，从而影响性能。

总结

Type Feedback 是 V8 引擎中一个非常重要的优化技术。它可以帮助 V8 更好地理解你的代码，并生成针对特定类型的优化代码。为了让 V8 更好地优化你的代码，你应该尽量编写 Type Feedback 友好的代码。

一些额外的思考

JIT 编译器和解释器： V8 实际上包含了两个主要的组件：一个解释器 (Ignition) 和一个 JIT (Just-In-Time) 编译器 (TurboFan)。解释器负责快速启动代码，而 JIT 编译器则负责生成优化后的机器码。 Type Feedback 在这两个组件中都起着重要的作用。
V8 的版本更新： V8 引擎在不断地更新和改进。新版本的 V8 可能会引入新的优化技术，或者改进现有的优化技术。因此，你需要不断地学习和了解 V8 的最新发展。
与其他引擎的比较： 不同的 JavaScript 引擎 (比如 SpiderMonkey, JavaScriptCore) 都有自己独特的优化技术。了解不同引擎的优化技术，可以帮助你编写更具可移植性的代码。

表格总结

特性	描述	影响
Type Feedback	V8 收集代码中变量、属性、函数调用等地方的类型信息的过程。	允许 V8 进行内联缓存、类型特化等优化，提高代码性能。
隐藏类	V8 用来描述对象结构的一种内部数据结构。	可以用来快速查找对象的属性，避免每次都进行完整的属性查找过程。
反馈向量	V8 用来存储类型信息的一种数据结构。	包含了变量、属性、函数调用等地方的类型信息，供 V8 进行优化。
内联缓存	缓存属性查找的结果，避免每次都进行完整的属性查找过程。	可以显著提高属性访问的性能。
类型特化	V8 根据类型信息，生成针对特定类型的优化代码。	可以显著提高代码的性能。
去优化	V8 放弃之前的优化，回到更慢但更通用的代码版本的过程。	当 Type Feedback 发现类型信息发生了变化时，V8 可能会进行去优化。去优化是一个代价很高的操作，因为它会使代码的性能下降。
Type Feedback 友好的代码	避免类型转换、保持类型一致、使用字面量、避免使用 `eval` 和 `with`。	可以让 V8 更好地优化你的代码，提高代码性能。

好了，今天的讲座就到这里。希望大家对 Type Feedback 有了更深入的了解。记住，编写 Type Feedback 友好的代码，可以让你的 JavaScript 代码跑得更快！下次再见！

发表回复 取消回复

发表回复取消回复