快照测试（Snapshot Testing）实现：序列化 DOM 树与 Diff 算法的应用

大家好，今天我们来深入探讨一个在前端自动化测试中非常重要的技术——快照测试（Snapshot Testing）。它不仅广泛应用于 React、Vue 等现代框架的测试体系中，而且背后涉及了两个核心概念：DOM 树的序列化 和 Diff 算法的巧妙应用。

这篇文章将以讲座形式展开，从原理讲到实践，逐步拆解快照测试如何通过将 UI 结构“拍照”保存，并在后续运行时进行对比，从而发现意外变更。我们还会用代码演示整个流程，帮助你真正理解其底层机制。

一、什么是快照测试？

快照测试是一种用于验证 UI 组件输出是否发生变化的测试方法。它的核心思想是：

“如果组件渲染的结果和上次一样，那就说明没有引入 bug。”

具体来说，每次测试运行时：

渲染目标组件；
将其结构（通常是虚拟 DOM 或真实 DOM）序列化为字符串；
与已保存的“快照文件”进行比对；
若不同，则失败并提示差异；若相同，则通过。

这特别适用于那些视觉变化难以手动检查的场景，比如样式调整、布局微调或状态更新导致的 DOM 变动。

常见工具如 Jest（React）、Vitest（Vue）、Playwright（E2E）都内置了快照测试能力。

二、为什么需要序列化 DOM 树？

要实现快照测试，第一步必须把组件渲染后的 HTML 或虚拟 DOM 转换成一种可存储、可比较的形式 —— 这就是序列化的作用。

2.1 序列化的必要性

跨平台一致性：浏览器环境复杂，直接比较 DOM 对象不可靠。
版本控制友好：文本格式便于 Git 跟踪差异。
性能优化：相比逐节点遍历比对，字符串 diff 更高效。

例如，在 React 中，ReactTestRenderer 提供了一个 .toJSON() 方法，可以把组件树转成类似 JSON 的结构，这就是一种轻量级序列化方式。

// 示例：使用 ReactTestRenderer 序列化组件
import React from 'react';
import { render } from 'react-dom';
import { create } from 'react-test-renderer';

function MyComponent({ name }) {
  return <div className="greeting">Hello, {name}!</div>;
}

const tree = create(<MyComponent name="Alice" />);
console.log(tree.toJSON());
// 输出：
// {
//   type: 'div',
//   props: { className: 'greeting' },
//   children: ['Hello, Alice!']
// }

这个对象可以轻松写入文件作为快照，也能用于后续 diff 比较。

2.2 序列化 vs 原始 DOM

很多人会问：“为什么不直接拿 innerHTML？”
答案是：原始 DOM 不稳定！

<!-- 浏览器可能自动修复不规范标签 -->
<div><p>Hello</p></div>
<!-- 实际生成可能是： -->
<div><p>Hello</p></div>
<!-- 但某些情况下会被补全或重排 -->

而序列化后的结构（如 React 的 toJSON()）具有确定性和可预测性，更适合做自动化比对。

特性	原始 DOM (`innerHTML`)	序列化对象（如 toJSON）
稳定性	❌ 易受浏览器解析影响	✅ 高度一致
可读性	❌ 不易阅读	✅ 结构清晰
易于 diff	❌ 复杂（需 DOM 解析）	✅ 字符串/对象 diff 即可
存储体积	⚠️ 较大（含属性、事件等）	✅ 轻量（仅关键信息）

三、Diff 算法的核心作用：识别变化点

有了序列化的数据后，下一步就是判断当前快照是否与历史快照一致。这就需要用到 Diff 算法 —— 它不是简单的字符串相等比较，而是要找出哪些地方变了，以便精准定位问题。

3.1 为什么不能只做字符串比较？

假设我们有一个组件：

function Button({ label, disabled }) {
  return (
    <button disabled={disabled}>{label}</button>
  );
}

第一次快照：

{
  "type": "button",
  "props": {
    "disabled": false,
    "children": ["Click me"]
  }
}

第二次修改为：

{
  "type": "button",
  "props": {
    "disabled": true,
    "children": ["Click me"]
  }
}

如果只是做字符串比较（如 snapshot === current），虽然能检测出不同，但无法告诉你具体是哪个属性变了（比如 disabled）。这会让开发者很难调试。

所以我们要的是 结构性差异分析，即 Diff 算法。

3.2 使用最小差异算法：Levenshtein Distance & JSON Diff

最常用的策略是结合两种技术：

Levenshtein Distance（编辑距离）：计算两段字符串之间的最小插入/删除/替换次数，适合简单文本比较；
JSON Deep Diff：递归比较对象结构，标记新增、删除、修改字段。

示例：手动实现简易 Diff 函数（用于快照）

function deepEqual(obj1, obj2) {
  if (obj1 === obj2) return true;

  if (typeof obj1 !== 'object' || typeof obj2 !== 'object') {
    return obj1 === obj2;
  }

  const keys1 = Object.keys(obj1);
  const keys2 = Object.keys(obj2);

  if (keys1.length !== keys2.length) return false;

  for (let key of keys1) {
    if (!keys2.includes(key)) return false;
    if (!deepEqual(obj1[key], obj2[key])) return false;
  }

  return true;
}

function generateDiff(snapshot, current) {
  if (deepEqual(snapshot, current)) {
    return null; // 无变化
  }

  const changes = [];
  const allKeys = new Set([...Object.keys(snapshot), ...Object.keys(current)]);

  for (let key of allKeys) {
    const sVal = snapshot[key];
    const cVal = current[key];

    if (sVal === undefined) {
      changes.push(`+ ${key}: ${JSON.stringify(cVal)}`);
    } else if (cVal === undefined) {
      changes.push(`- ${key}: ${JSON.stringify(sVal)}`);
    } else if (!deepEqual(sVal, cVal)) {
      changes.push(`~ ${key}: ${JSON.stringify(sVal)} → ${JSON.stringify(cVal)}`);
    }
  }

  return changes.join('n');
}

现在我们可以这样使用它：

const oldSnapshot = {
  type: 'button',
  props: { disabled: false, children: ['Click me'] }
};

const newSnapshot = {
  type: 'button',
  props: { disabled: true, children: ['Click me'] }
};

console.log(generateDiff(oldSnapshot, newSnapshot));
// 输出：
// ~ props.disabled: false → true

✅ 这样就能清楚看到到底是哪个属性变了！

🔍 实际项目中，Jest 使用的是 jest-diff 包，它支持更复杂的嵌套结构、数组、函数等差异展示，但我们这里用自定义逻辑展示了核心思路。

四、完整快照测试流程示例（以 React + Jest 为例）

让我们模拟一个完整的快照测试过程，包含三个阶段：

首次运行：生成快照
第二次运行：比对快照
第三次运行：主动修改组件

4.1 编写组件和测试文件

// components/Button.js
export default function Button({ label, disabled }) {
  return (
    <button disabled={disabled} className="btn">
      {label}
    </button>
  );
}

// __tests__/Button.test.js
import React from 'react';
import { render } from '@testing-library/react';
import Button from '../components/Button';
import { create } from 'react-test-renderer';

describe('Button', () => {
  it('renders correctly', () => {
    const tree = create(<Button label="Submit" disabled={false} />);
    expect(tree.toJSON()).toMatchSnapshot();
  });
});

首次运行时，Jest 会自动生成如下快照文件：

// __snapshots__/Button.test.js.snap
exports[`Button renders correctly 1`] = `
<button
  className="btn"
  disabled={false}
>
  Submit
</button>
`;

4.2 第二次运行：比对成功

如果你不做任何改动，再次运行测试，Jest 会读取快照并执行深比较，确认一致，测试通过。

4.3 第三次运行：故意修改组件

现在我们改一下按钮：

// 修改 Button.js
export default function Button({ label, disabled }) {
  return (
    <button disabled={disabled} className="btn primary">
      {label}
    </button>
  );
}

重新运行测试：

 FAIL  __tests__/Button.test.js
  ● Button › renders correctly

    expect(received).toMatchSnapshot()

    Snapshot name: `Button renders correctly 1`

    - Snapshot
    + Received

    @@ -1,3 +1,3 @@
     <button
    -  className="btn"
    +  className="btn primary"
       disabled={false}>
       Submit
     </button>

💡 这正是 Diff 算法发挥作用的地方！它精确指出 className 从 "btn" 变成了 "btn primary"，而不是笼统地说“整个组件变了”。

五、进阶技巧：如何处理动态内容？

现实中的组件往往包含时间戳、随机数、用户输入等动态内容，这些会导致快照频繁失败。

5.1 解决方案一：Mock 时间或随机值

beforeEach(() => {
  jest.useFakeTimers();
});

afterEach(() => {
  jest.restoreAllMocks();
});

it('should not fail due to time', () => {
  const tree = create(<TimeDisplay />);
  expect(tree.toJSON()).toMatchSnapshot();
});

5.2 解决方案二：使用 `jest.mock()` 替换依赖

jest.mock('some-random-module', () => ({
  getRandomId: () => 'mocked-id'
}));

5.3 解决方案三：使用 `toMatchSnapshot()` 的选项

expect(tree.toJSON()).toMatchSnapshot({
  skip: ['randomField'], // 忽略某个字段
  omit: ['timestamp']   // 删除特定字段后再比对
});

这些技巧能让快照测试更健壮，避免因非本质变化导致误报。

六、总结：快照测试的本质是什么？

快照测试并不是魔法，它的本质是一个 基于结构化数据的回归测试系统，依赖两大核心技术：

技术	作用	关键点
序列化 DOM 树	将 UI 转为稳定、可存储的数据结构	使用虚拟 DOM（React）或 toJSON() 方法
Diff 算法	判断前后差异，提供明确反馈	不仅看“变没变”，还要看“怎么变”

✅ 它的优势在于：

自动化程度高，减少人工核对；
快速发现问题（尤其样式、结构类 Bug）；
支持可视化 diff 工具（如 VS Code 插件）。

⚠️ 但它也有局限：

不适合测试交互行为（应配合用户操作测试）；
快照文件容易膨胀，需定期清理；
若滥用，可能导致测试脆弱（建议结合单元测试 + E2E）。

最后建议

如果你正在搭建一套前端测试体系，请优先考虑以下顺序：

单元测试（如 Jest + React Testing Library）→ 验证逻辑正确性；
快照测试（如 Jest Snapshot）→ 保证 UI 稳定性；
E2E 测试（如 Playwright / Cypress）→ 模拟真实用户路径。

这样组合拳才能既快速又可靠地保障产品质量。

希望今天的分享让你对快照测试有了更深的理解 —— 不再只是“点了个按钮就生成快照”，而是明白了它背后的逻辑之美：序列化 + Diff = 可信的自动化 UI 验证。

谢谢大家！欢迎提问交流。