什么是 ‘Mutable Source’？探讨 React 官方对“可变数据源”在异步渲染下的处理态度演变 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

深入理解 React 中的“可变数据源”及其在异步渲染下的处理演变

女士们，先生们，大家好！

今天，我们将深入探讨一个在前端开发，尤其是在 React 应用中，既基础又极其关键的概念——“可变数据源”（Mutable Source）。我们将从其基本定义出发，逐步剖析它在 React 传统同步渲染模式下可能带来的问题，进而聚焦于 React 18 引入的并发渲染（Concurrent Rendering）机制如何放大这些挑战，并最终详细解读 React 官方为应对这些挑战所做出的努力和提供的解决方案，特别是 useSyncExternalStore 这个强大的 Hook。

1. 什么是“可变数据源”？

在编程领域，数据源指的是应用程序获取数据的来源。它可以是内存中的变量、对象、数据库、网络请求的响应等等。当一个数据源被称为“可变”（Mutable）时，意味着它的内容或状态可以在创建后被修改。与之相对的是“不可变”（Immutable）数据源，一旦创建，其内容就不能被改变，任何修改都会生成一个新的数据副本。

在 JavaScript 中，大多数对象和数组都是可变的。例如：

// 可变对象
const user = { name: 'Alice', age: 30 };
user.age = 31; // user对象被修改了

// 可变数组
const numbers = [1, 2, 3];
numbers.push(4); // numbers数组被修改了

// 不可变数据（原始类型）
let name = 'Bob';
name = 'Charlie'; // 这里的操作不是修改'Bob'，而是将name变量指向了一个新的字符串'Charlie'

当我们在 React 组件中使用这些可变数据源时，问题就可能浮现。React 的核心思想之一是基于状态（State）和属性（Props）来驱动 UI 渲染。它期望这些数据是可预测的，并且在渲染周期内保持稳定。

2. React 传统渲染模式下的可变数据源

在 React 18 之前的版本中，渲染过程主要是同步的。这意味着当 React 决定更新 UI 时（例如，通过 setState 或 forceUpdate），它会立即执行组件的渲染函数，并尽可能快地将更新应用到 DOM 上。

即使在同步模式下，直接修改作为 props 或 state 的可变数据源也是一个不推荐的实践，因为它可能导致以下问题：

难以追踪变更： 当多个部分直接修改同一个可变对象时，很难知道是哪个部分在何时做了什么修改，从而导致调试困难。
跳过优化： React 使用浅比较来优化性能（例如 PureComponent 或 React.memo）。如果一个可变对象被修改了但引用没有变，浅比较会认为数据没有变化，从而跳过重新渲染，导致 UI 不更新。
不确定性： 尤其是在副作用（如 useEffect）中，如果可变数据源在副作用执行前被修改，可能导致副作用逻辑基于陈旧或不一致的数据。

考虑以下示例：

// 错误的实践：直接修改props中的可变对象
function UserProfile({ user }) {
  // 假设这里在某些交互后需要更新用户数据
  // 这是一个反模式，user是props，不应该直接修改
  // React无法感知到user.age的内部变化
  // user.age = 31; // ❌ 绝对不要这样做！
  // user.name = 'Bob'; // ❌

  // 正确的做法是通知父组件通过回调更新数据，或者使用内部state
  return (
    <div>
      <p>Name: {user.name}</p>
      <p>Age: {user.age}</p>
    </div>
  );
}

function App() {
  const [currentUser, setCurrentUser] = React.useState({ name: 'Alice', age: 30 });

  const updateAge = () => {
    // 错误示范：直接修改并传递，React可能无法正确检测到更新
    // const newUser = currentUser;
    // newUser.age += 1;
    // setCurrentUser(newUser); // ❌ 仍是传递了同一个引用

    // 正确的做法：创建新对象，保持不可变性
    setCurrentUser(prevUser => ({
      ...prevUser,
      age: prevUser.age + 1
    }));
  };

  return (
    <div>
      <UserProfile user={currentUser} />
      <button onClick={updateAge}>Happy Birthday!</button>
    </div>
  );
}

在这个例子中，即使 UserProfile 组件收到的 user prop 是一个可变对象，React 仍然期望我们通过 setState 来提供一个新的 currentUser 引用，这样它才能正确触发重新渲染并应用变更。这是 React 声明式 UI 的核心要求。

3. 并发渲染（Concurrent Rendering）的挑战

React 18 引入的并发渲染是 React 架构上的一项重大变革。它允许 React 在不阻塞主线程的情况下，同时处理多个渲染任务，甚至可以暂停、中断或重新启动渲染。这项特性极大地提升了用户体验，使得应用在处理大量数据更新或复杂动画时依然保持流畅。

然而，并发渲染对可变数据源的管理提出了更高的要求，并可能导致一种被称为“撕裂”（Tearing）的严重问题。

3.1 什么是并发渲染？

在传统同步模式下，React 总是“一次性”完成一个渲染任务。一旦开始，它就会一直执行直到完成，然后才将结果提交给 DOM。

并发渲染则不同：

可中断性： React 可以在渲染过程中暂停，让浏览器处理优先级更高的任务（如用户输入、动画），然后再恢复渲染。
可重放性： 如果在渲染过程中，某个状态发生了变化，React 可以直接放弃当前正在进行的渲染工作，从头开始一个新的渲染周期。
优先级调度： 不同的更新可以有不同的优先级。例如，用户输入事件的更新优先级高于后台数据加载的更新。

这一切的背后，是 React 在内存中维护了一个被称为“工作树”（Work Tree）的结构。当状态更新发生时，React 会在后台构建新的工作树，而不是直接操作当前的渲染结果。只有当新的工作树构建完成并稳定后，它才会被“提交”（Commit）到实际的 DOM 中。

3.2 可变数据源在并发渲染下的“撕裂”问题

假设我们有一个外部的可变数据源（不在 React state 或 context 中管理），它可能在 React 渲染过程中被修改。

考虑以下场景：

React 开始渲染一个组件树。
在渲染组件 A 时，它从外部可变数据源读取了一个值 V1。
React 暂停渲染（可能由于优先级更低的更新，或浏览器需要处理其他任务）。
在 React 暂停期间，外部可变数据源被其他代码（例如，一个定时器，一个事件监听器，或者另一个 React 渲染周期）修改为 V2。
React 恢复渲染，继续渲染组件 B。
在渲染组件 B 时，它从同一个外部可变数据源读取了值 V2。

现在，组件 A 和组件 B 虽然在同一个逻辑渲染周期内，但它们却读取到了外部数据源的不同版本（V1 和 V2）。这就像一张图片被撕成了两半，每一半显示了不同的时间点，从而造成了 UI 的不一致性，这就是“撕裂”问题。

示例：模拟撕裂

// 模拟一个外部可变数据源
const externalStore = {
  value: 0,
  listeners: [],
  getValue() {
    return this.value;
  },
  setValue(newValue) {
    this.value = newValue;
    this.listeners.forEach(listener => listener());
  },
  subscribe(listener) {
    this.listeners.push(listener);
    return () => {
      this.listeners = this.listeners.filter(l => l !== listener);
    };
  }
};

// 模拟一个在外部修改数据源的函数
let updateCount = 0;
const simulateExternalMutation = () => {
  updateCount++;
  externalStore.setValue(updateCount);
  console.log(`External store updated to: ${updateCount}`);
};

// 每隔一段时间模拟一次外部修改
// setInterval(simulateExternalMutation, 500); // 暂时注释，避免干扰演示

function DisplayComponentA() {
  // 这里我们假设没有useSyncExternalStore，而是直接读取
  const val = externalStore.getValue();
  // 模拟一个耗时的渲染，增加撕裂的可能性
  let startTime = performance.now();
  while (performance.now() - startTime < 5) {
    // 忙等5毫秒
  }
  return <p>Component A reads: {val}</p>;
}

function DisplayComponentB() {
  const val = externalStore.getValue();
  return <p>Component B reads: {val}</p>;
}

function TearingDemo() {
  const [_, forceUpdate] = React.useReducer(x => x + 1, 0);

  React.useEffect(() => {
    // 订阅外部数据源，当它变化时强制更新React组件
    const unsubscribe = externalStore.subscribe(forceUpdate);
    return unsubscribe;
  }, []);

  return (
    <div>
      <h3>撕裂问题演示 (模拟)</h3>
      <p>点击按钮模拟外部数据源变化，并观察 A 和 B 是否显示相同值。</p>
      <button onClick={simulateExternalMutation}>
        修改外部数据源并触发更新
      </button>
      <React.StrictMode> {/* StrictMode有助于暴露并发问题 */}
        <DisplayComponentA />
        <DisplayComponentB />
      </React.StrictMode>
    </div>
  );
}

// 运行TearingDemo，并多次点击按钮，在某些情况下，你可能会看到A和B显示不同的值
// 在实际并发模式下，这种撕裂会更常见且难以预测

在上述 TearingDemo 中，如果 DisplayComponentA 在渲染过程中，externalStore.value 被 simulateExternalMutation 修改了，那么 DisplayComponentB 可能会读取到修改后的值，而 DisplayComponentA 仍然显示修改前的值，这就是撕裂。

4. React 官方对可变数据源的处理态度演变

React 团队深知并发渲染带来的巨大潜力，也清楚地认识到外部可变数据源可能造成的撕裂问题。为了解决这一挑战，React 官方采取了一系列措施，其核心思想是为外部可变数据源提供一个安全的、与并发渲染兼容的桥梁。

4.1 早期探索：`useMutableSource` (实验性，已废弃)

在 React 18 稳定版发布之前，React 团队曾实验性地引入了一个 Hook 叫做 useMutableSource。它的设计理念是让开发者明确告诉 React，组件正在监听一个外部的可变数据源，并提供一种机制来获取其当前值以及订阅其变更。

useMutableSource 的大致用法如下：

// 假设有一个 createMutableSource 函数，它能创建一个可变数据源的描述符
const source = createMutableSource(someExternalStore, getVersion);

function MyComponent() {
  // useMutableSource 接收 source 和 selector
  // selector 用于从数据源中提取需要的值
  const value = useMutableSource(source, (s) => s.data);

  return <div>{value}</div>;
}

getVersion 函数在这里至关重要。它需要返回一个数字或字符串，代表数据源的“版本”。每当数据源发生变化时，getVersion 应该返回一个不同的值。React 会利用这个版本号在并发渲染过程中检测数据源是否被修改，从而避免撕裂。

废弃原因：

尽管 useMutableSource 旨在解决撕裂问题，但它被证明过于复杂且难以正确实现。开发者需要手动管理版本号，这增加了心智负担和出错的可能性。例如，如果 getVersion 实现不当，或者版本更新与数据更新不同步，仍然可能导致问题。此外，它对外部数据源的结构也有一定的要求。

最终，React 团队决定放弃 useMutableSource，转而寻找一个更简洁、更鲁棒的解决方案。

4.2 最终方案：`useSyncExternalStore` (React 18+)

在放弃 useMutableSource 之后，React 团队开发并推出了 useSyncExternalStore Hook，作为 React 18 的核心特性之一。这个 Hook 旨在提供一种标准且安全的方式，让 React 组件能够订阅外部可变数据源，同时确保在并发渲染模式下不会发生撕裂。

useSyncExternalStore 的核心思想是：强制同步读取和原子性快照。

它要求提供两个关键函数：

subscribe: 一个函数，接收一个回调函数作为参数。当外部数据源发生变化时，subscribe 必须调用这个回调函数。它应该返回一个取消订阅的函数。
getSnapshot: 一个函数，返回外部数据源的当前快照。这个快照必须是不可变的值。

useSyncExternalStore 的工作原理：

当 React 开始渲染一个组件时，它会调用 getSnapshot 来获取外部数据源的当前快照。
在整个渲染周期中（即使是暂停和恢复），React 都会使用这个快照来保证数据的一致性。
在提交阶段（commit phase），React 会再次调用 getSnapshot。
如果第二次 getSnapshot 返回的值与第一次获取的快照不同，React 会检测到不一致（即在渲染期间外部数据源被修改了），并会立即重新渲染整个组件树，从而修复撕裂问题。
subscribe 函数确保当外部数据源发生变化时，React 能够得到通知并触发新的渲染。

语法：

import { useSyncExternalStore } from 'react';

function MyComponent() {
  const state = useSyncExternalStore(subscribe, getSnapshot, getServerSnapshot);
  // ...
}

subscribe: 一个函数，用于订阅外部数据源的变化。它接收一个 callback 函数，并在数据源变化时调用 callback。返回一个取消订阅的函数。
getSnapshot: 一个函数，返回外部数据源的当前值（快照）。这个函数必须返回一个不可变的值。
getServerSnapshot (可选): 一个函数，用于在服务器渲染（SSR）时获取数据源的初始快照。如果没有提供，或者在客户端渲染时，getSnapshot 会被调用。它的存在是为了解决 SSR 水合（Hydration）时的不匹配问题。

4.3 解决撕裂问题的实际示例

让我们使用 useSyncExternalStore 来重构之前的撕裂演示。

import React, { useSyncExternalStore, useReducer, useEffect } from 'react';

// 模拟一个外部可变数据源
const externalStore = {
  value: 0,
  listeners: new Set(), // 使用Set更方便管理监听器
  getValue() {
    return this.value;
  },
  setValue(newValue) {
    this.value = newValue;
    // 通知所有订阅者
    this.listeners.forEach(listener => listener());
  },
  subscribe(listener) {
    this.listeners.add(listener);
    return () => {
      this.listeners.delete(listener);
    };
  }
};

// 模拟一个在外部修改数据源的函数
let globalUpdateCount = 0;
const simulateExternalMutation = () => {
  globalUpdateCount++;
  externalStore.setValue(globalUpdateCount);
  console.log(`External store updated to: ${globalUpdateCount}`);
};

// 定义 subscribe 和 getSnapshot 函数，供 useSyncExternalStore 使用
const subscribeToExternalStore = (callback) => {
  return externalStore.subscribe(callback);
};

const getExternalStoreSnapshot = () => {
  return externalStore.getValue();
};

// 假设在SSR场景下，我们有一个初始值
const getExternalStoreServerSnapshot = () => {
  return 0; // 初始值为0，或者根据实际SSR逻辑获取
};

function SafeDisplayComponentA() {
  const val = useSyncExternalStore(
    subscribeToExternalStore,
    getExternalStoreSnapshot,
    getExternalStoreServerSnapshot
  );

  // 模拟一个耗时的渲染，增加并发渲染下检测撕裂的可能性
  let startTime = performance.now();
  while (performance.now() - startTime < 5) {
    // 忙等5毫秒
  }
  return <p>Component A reads: {val}</p>;
}

function SafeDisplayComponentB() {
  const val = useSyncExternalStore(
    subscribeToExternalStore,
    getExternalStoreSnapshot,
    getExternalStoreServerSnapshot
  );
  return <p>Component B reads: {val}</p>;
}

function SafeTearingDemo() {
  // useSyncExternalStore 内部会处理更新，这里不再需要 forceUpdate
  // 仅为了演示外部触发，保留一个按钮
  return (
    <div>
      <h3>使用 useSyncExternalStore 解决撕裂问题</h3>
      <p>点击按钮模拟外部数据源变化。A 和 B 始终显示相同值。</p>
      <button onClick={simulateExternalMutation}>
        修改外部数据源并触发更新
      </button>
      <React.StrictMode>
        <SafeDisplayComponentA />
        <SafeDisplayComponentB />
      </React.StrictMode>
    </div>
  );
}

// 运行 SafeTearingDemo，无论如何点击按钮，A 和 B 都将显示相同的值，
// 因为 useSyncExternalStore 保证了在同一渲染周期内获取的是一致的快照。

通过 useSyncExternalStore，React 有能力在渲染期间检测到外部数据源的突变。如果它发现在渲染过程中，快照发生了变化，它会强制重新启动渲染，确保所有组件都基于最新的、一致的快照进行渲染，从而彻底消除了撕裂问题。

4.4 为什么 `useSyncExternalStore` 比 `useMutableSource` 更好？

特性	`useMutableSource` (已废弃)	`useSyncExternalStore` (推荐)
设计理念	追踪数据源的“版本”，通过版本号检测变化。	获取数据源的“快照”，通过快照比较检测变化，并强制同步读取。
API 复杂度	需要开发者实现 `getVersion` 函数，并确保其正确性和一致性。	只需要提供 `subscribe` 和 `getSnapshot`，更聚焦于数据源本身。
实现难度	正确管理版本号和其与数据更新的同步关系具有挑战性。	相对简单，只需正确实现订阅和快照获取逻辑。
撕裂检测	基于版本号的比较。	基于快照的深层或浅层（取决于快照内容）比较，更可靠。
性能	可能需要频繁调用 `getVersion`。	`getSnapshot` 可能会在渲染过程中被调用两次（在渲染开始和提交时），但通常性能开销可接受。
SSR 支持	需要额外的机制来处理 SSR。	内置 `getServerSnapshot` 支持 SSR。
适用场景	适用于各种外部可变数据源。	适用于各种外部可变数据源，包括浏览器 API (如 `window.matchMedia`)、自定义状态管理库等。

useSyncExternalStore 的优势在于它将复杂性封装在 React 内部，让开发者只需关注数据源的订阅和快照获取，大大降低了使用的心智负担和出错的概率。

5. 其他处理可变数据源的策略和最佳实践

虽然 useSyncExternalStore 是处理外部可变数据源在并发模式下撕裂问题的终极武器，但对于 React 应用程序内部的数据管理，我们仍然应该遵循一些基本的原则和最佳实践：

5.1 提升状态（Lifting State Up）

将共享的可变状态提升到它们共同的最近的父组件中，并通过 props 传递给子组件。子组件通过回调函数来请求父组件更新状态，父组件则通过 setState 或 useReducer 来更新。这确保了所有相关组件都从一个单一的真实来源获取状态，并且状态的更新由 React 统一管理。

function ChildA({ data, onUpdate }) {
  return (
    <button onClick={() => onUpdate(data + 1)}>Update Data from A: {data}</button>
  );
}

function ChildB({ data }) {
  return <p>Data in B: {data}</p>;
}

function ParentComponent() {
  const [sharedData, setSharedData] = React.useState(0);

  const handleUpdate = (newValue) => {
    setSharedData(newValue);
  };

  return (
    <div>
      <ChildA data={sharedData} onUpdate={handleUpdate} />
      <ChildB data={sharedData} />
    </div>
  );
}

5.2 保持不可变性（Immutability）

这是 React 和函数式编程的核心原则。始终通过创建新对象或新数组来“修改”数据，而不是直接修改现有数据。这使得状态变化可预测，并能更好地利用 React 的渲染优化。

对于对象： 使用扩展运算符 ... 或 Object.assign()。
```
const newState = { ...prevState, key: newValue };
```

对于数组： 使用 map, filter, slice, 扩展运算符 ... 等。

const newArray = [...prevArray, newItem]; // 添加
const newArray = prevArray.filter(item => item.id !== idToRemove); // 删除
const newArray = prevArray.map(item => item.id === idToUpdate ? { ...item, updatedProp: true } : item); // 更新

使用 Immer.js： 这是一个流行的库，允许你像修改可变数据一样编写代码，但它会在幕后处理不可变更新，自动生成新的不可变状态。

import produce from 'immer';

const baseState = {
  user: {
    name: 'Alice',
    age: 30
  }
};

const nextState = produce(baseState, draft => {
  draft.user.age += 1; // 看起来是可变修改，实际生成了新的不可变对象
});

5.3 `useRef` 的正确使用场景

useRef 可以用来存储在组件生命周期内保持不变的可变值，但这些值不会触发组件重新渲染。它通常用于：

引用 DOM 元素。
存储组件实例变量（如定时器 ID）。
存储在渲染之间需要保持的可变值，但其变化不应该触发渲染。

关键点： useRef 存储的值不会触发重新渲染。如果你需要一个值既可变又能在变化时触发渲染，那么它应该是一个 state。

function MyComponentWithRef() {
  const countRef = React.useRef(0); // 存储一个可变值，但其变化不触发渲染
  const [countState, setCountState] = React.useState(0); // 存储一个可变值，其变化触发渲染

  const incrementRef = () => {
    countRef.current += 1;
    console.log('Ref Count:', countRef.current);
    // UI 不会更新，因为ref的变化不触发渲染
  };

  const incrementState = () => {
    setCountState(prev => prev + 1);
    console.log('State Count:', countState);
    // UI 会更新
  };

  return (
    <div>
      <p>Ref Count (UI not updated): {countRef.current}</p> {/* 这里显示的是渲染时的快照 */}
      <button onClick={incrementRef}>Increment Ref</button>

      <p>State Count (UI updated): {countState}</p>
      <button onClick={incrementState}>Increment State</button>
    </div>
  );
}

5.4 状态管理库

许多状态管理库（如 Redux, Zustand, Jotai, Recoil）都内置了对不可变性或与 React 渲染机制兼容的解决方案。它们通常会提供自己的订阅机制，并且许多现代库已经内部集成了 useSyncExternalStore 或类似机制来确保与并发模式的兼容性。

6. 总结与展望

“可变数据源”在 React 应用中是一个双刃剑。虽然 JavaScript 本身提供了强大的可变性，但在 React 声明式和基于状态驱动的范式中，尤其是在 React 18 引入并发渲染之后，对可变数据源的管理变得尤为重要。

从早期对 useMutableSource 的探索到最终定型 useSyncExternalStore，我们看到了 React 团队在解决这一复杂问题上的演进。useSyncExternalStore 为我们提供了一个坚实的桥梁，安全地将外部可变世界与 React 的并发渲染机制连接起来，彻底解决了撕裂问题。

对于我们开发者而言，理解这些机制并遵循最佳实践至关重要：

内部状态优先使用不可变性： 保持组件内部状态和 props 的不可变性，是构建可预测、易于维护和高性能 React 应用的基石。
外部数据源使用 useSyncExternalStore： 当你不得不依赖一个不受 React 控制的外部可变数据源时，useSyncExternalStore 是你的最佳选择，它确保了 UI 的一致性。
慎用 useRef： 仅当数据变化不需要触发组件重新渲染时，才考虑使用 useRef 来存储可变值。

随着 React 在并发模式和服务器组件（Server Components）等方向的不断演进，对数据流和状态管理的精确控制将变得更加关键。深入理解这些核心概念，将帮助我们构建更加健壮、高性能且用户体验更佳的现代化 React 应用程序。