JS `Tree Shaking` 与 `Side Effects` 的 ESM 语义分析限制与规避 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

各位观众老爷们，晚上好！我是你们的老朋友，今天咱们聊聊JS Tree Shaking这档子事儿，顺带掰扯掰扯Side Effects带来的那些爱恨情仇。

开场白：摇晃吧，别摇掉我的代码！

Tree Shaking，听着挺玄乎，其实就是个“摇树”的过程。把咱们代码里那些没用的枝枝蔓蔓（dead code）给摇下来，减小打包体积，提高性能。这玩意儿，用得好，省带宽，用不好，代码直接给你摇没了，让你哭都没地方哭。

而Side Effects，中文叫“副作用”，听着就不是什么好词。指的是函数或表达式除了返回值之外，还修改了外部状态，比如修改了全局变量，DOM等等。这些副作用，会严重影响Tree Shaking的效果，一不小心就让摇树器手软，不敢下手。

所以今天咱们的任务就是：搞清楚Tree Shaking的原理，摸清Side Effects的底细，学会如何写出更友好的代码，让Tree Shaking摇得更彻底，摇得更安全。

第一幕：Tree Shaking的底层逻辑

要理解Tree Shaking，首先要搞清楚ESM（ES Modules）的静态分析特性。

ESM和CommonJS最大的区别之一就是，ESM是静态导入/导出，而CommonJS是动态的。啥意思呢？

静态导入/导出 (ESM): 在编译时就能确定模块之间的依赖关系。这就好比你写了一张购物清单，清单上的东西一目了然，超市收银员可以提前准备好。
动态导入/导出 (CommonJS): 只有在运行时才能确定模块之间的依赖关系。这就好比你边逛超市边写购物清单，收银员只能等你走到收银台才能开始准备。

正是因为ESM的静态特性，Tree Shaking才能发挥作用。摇树器通过静态分析ESM的import和export语句，构建出一个依赖关系图。然后，从入口文件开始，沿着依赖关系图，标记出所有被使用的模块和变量。最后，把那些没有被标记的模块和变量统统砍掉。

举个栗子：

// math.js
export function add(a, b) {
  return a + b;
}

export function subtract(a, b) {
  return a - b;
}

// main.js
import { add } from './math.js';

console.log(add(1, 2));

在这个例子中，math.js导出了add和subtract两个函数，但是main.js只使用了add函数。经过Tree Shaking之后，subtract函数就会被移除，最终打包出来的文件只包含add函数。

第二幕：Side Effects的捣蛋之旅

Side Effects是Tree Shaking的头号劲敌。摇树器在进行静态分析的时候，必须非常小心地处理Side Effects，否则就可能误删代码，导致程序出错。

Side Effects主要分为两种：

显式副作用: 代码中明确地修改了外部状态，比如修改全局变量，DOM等等。
隐式副作用: 代码中虽然没有直接修改外部状态，但是依赖于外部状态，比如使用了Math.random()，Date.now()等等。

显式副作用很容易被发现，但是隐式副作用却非常隐蔽，容易被忽略。

来看个例子：

// utils.js
let counter = 0;

export function increment() {
  counter++;
  console.log(counter);
}

// main.js
import { increment } from './utils.js';

console.log('Before increment');

// increment(); // 注释掉这行

console.log('After increment');

在这个例子中，increment函数修改了全局变量counter，产生了副作用。如果main.js没有调用increment函数，摇树器可能会认为increment函数没有被使用，从而将其移除。但是，如果main.js稍后又动态地调用了increment函数，就会导致counter变量未定义，程序出错。

为了解决这个问题，我们需要告诉摇树器，increment函数具有副作用，不能被移除。这可以通过在package.json文件中添加"sideEffects": true来实现。

// package.json
{
  "name": "my-project",
  "version": "1.0.0",
  "sideEffects": true,
  "devDependencies": {
    "webpack": "^5.0.0"
  }
}

或者，我们可以更精确地指定哪些文件具有副作用：

// package.json
{
  "name": "my-project",
  "version": "1.0.0",
  "sideEffects": [
    "./utils.js"
  ],
  "devDependencies": {
    "webpack": "^5.0.0"
  }
}

这样，摇树器就会知道utils.js文件具有副作用，不会将其中的任何代码移除。

第三幕：规避Side Effects的奇技淫巧

虽然我们可以通过sideEffects配置来告诉摇树器哪些文件具有副作用，但是最好的办法还是尽量避免Side Effects，写出更纯粹的代码。

下面是一些规避Side Effects的技巧：

使用纯函数: 纯函数是指没有副作用的函数，即函数的返回值只依赖于输入参数，并且不会修改任何外部状态。
避免修改全局变量: 尽量避免在函数中修改全局变量，如果必须修改，可以使用局部变量来代替。
使用不可变数据结构: 使用不可变数据结构可以避免Side Effects，因为不可变数据结构在创建之后就不能被修改。
使用状态管理库: 使用状态管理库（比如Redux，Vuex）可以更好地管理应用的状态，避免Side Effects。

举个栗子：

// 糟糕的代码 (有副作用)
let count = 0;

function increment() {
  count++;
  return count;
}

// 更好的代码 (纯函数)
function increment(count) {
  return count + 1;
}

在第一个例子中，increment函数修改了全局变量count，产生了副作用。在第二个例子中，increment函数是一个纯函数，它只依赖于输入参数count，并且不会修改任何外部状态。

第四幕：高级技巧：/*#__PURE__*/ 注释

有时候，我们可能需要使用一些具有副作用的函数，但是我们又希望摇树器能够尽可能地进行优化。这时，我们可以使用/*#__PURE__*/注释来告诉摇树器，某个函数调用是“纯粹的”，即使它实际上具有副作用。

/*#__PURE__*/注释的作用是告诉摇树器，某个函数调用可以被安全地移除，即使它具有副作用。只有在非常确定的情况下才能使用这个注释，否则可能会导致程序出错。

举个栗子：

// utils.js
export function log(message) {
  console.log(message); // 具有副作用
}

// main.js
import { log } from './utils.js';

/*#__PURE__*/log('This message can be removed if not used');

在这个例子中，log函数具有副作用，因为它会向控制台输出消息。但是，我们使用了/*#__PURE__*/注释来告诉摇树器，这个log函数的调用可以被安全地移除，即使它具有副作用。

第五幕：各种构建工具的Tree Shaking配置

不同的构建工具，Tree Shaking的配置方式略有不同。

Webpack: Webpack 4+ 默认支持Tree Shaking。只需要保证你的代码是ESM格式，并且开启mode: 'production'即可。也可以通过optimization.usedExports选项来更精细地控制Tree Shaking的行为。
Rollup: Rollup从一开始就支持Tree Shaking，并且在Tree Shaking方面做得非常出色。Rollup默认情况下会尽可能地进行Tree Shaking，可以通过preserveModules选项来控制是否保留模块结构。
Parcel: Parcel也支持Tree Shaking，只需要保证你的代码是ESM格式即可。Parcel会自动进行Tree Shaking，无需额外配置。

为了方便大家查阅，我整理了一个表格，列出了常用构建工具的Tree Shaking配置：

构建工具	Tree Shaking支持	配置方式	备注
Webpack	默认支持	`mode: 'production'` 或 `optimization.usedExports: true`	确保代码是ESM格式，`sideEffects`配置也很重要。
Rollup	默认支持	无需额外配置，默认尽可能进行Tree Shaking。	可以通过插件（例如`@rollup/plugin-commonjs`）将CommonJS模块转换为ESM，以便进行Tree Shaking。
Parcel	默认支持	无需额外配置，自动进行Tree Shaking。	简单易用，但配置选项相对较少。

第六幕：实战演练：一个完整的例子

为了让大家更好地理解Tree Shaking的实际应用，我们来看一个完整的例子。

// utils.js
export function add(a, b) {
  console.log('Adding numbers'); // Side Effect
  return a + b;
}

export function multiply(a, b) {
  return a * b;
}

// main.js
import { add } from './utils.js';

const result = add(2, 3);
console.log(result);

// index.html
<!DOCTYPE html>
<html>
<head>
  <title>Tree Shaking Example</title>
</head>
<body>
  <script src="bundle.js"></script>
</body>
</html>

准备工作: 创建项目目录，初始化package.json，安装Webpack。
配置Webpack: 创建webpack.config.js文件，配置入口文件、输出文件和模式。
编写代码: 创建utils.js和main.js文件，编写代码。
构建项目: 运行webpack命令，生成bundle.js文件。
运行项目: 在浏览器中打开index.html文件，查看结果。

在这个例子中，utils.js导出了add和multiply两个函数，但是main.js只使用了add函数。由于add函数具有副作用（console.log），因此摇树器不会将其移除。multiply函数没有被使用，也没有副作用，因此会被摇掉。

第七幕：总结与展望

今天我们一起学习了JS Tree Shaking的原理、Side Effects的影响以及如何规避Side Effects。希望通过今天的学习，大家能够更好地理解Tree Shaking，写出更高效、更优化的代码。

记住，Tree Shaking不是万能的，它只能移除那些没有被使用的代码。要真正地提高性能，还需要从代码质量、算法优化等方面入手。

未来，随着JS技术的不断发展，Tree Shaking也会变得更加智能、更加高效。让我们一起期待Tree Shaking的未来！

谢幕：摇啊摇，摇到外婆桥！

感谢各位观众老爷们的观看，希望今天的讲座对大家有所帮助。如果大家还有什么问题，可以在评论区留言，我会尽力解答。咱们下期再见！

发表回复 取消回复

发表回复取消回复