OT（操作转换）算法实战：ShareDB 如何处理多人同时插入文本的冲突

各位开发者朋友，大家好！今天我们来深入探讨一个在实时协作编辑场景中非常关键的问题——如何让多个用户同时修改同一段文本而不产生混乱？

这个问题看似简单，实则复杂。比如你正在和同事一起写一份文档，你们几乎在同一时间输入了不同的内容，系统该怎么决定谁的改动应该生效？这背后的核心技术就是 操作转换（Operational Transformation, OT）。

我们今天的主角是 ShareDB —— 一个基于 OT 的开源协作框架，广泛用于 Google Docs、Notion 等多用户协同产品。我们将从原理讲起，逐步剖析它如何优雅地解决并发插入冲突，并通过真实代码演示其工作流程。

一、什么是操作转换（OT）？

✅ 定义

操作转换是一种用于分布式系统的同步机制，它允许不同客户端对共享数据进行独立操作，并确保这些操作最终能达成一致状态，即使它们在网络延迟或并发执行的情况下发生。

举个例子：

用户 A 在第 5 个字符前插入 “Hello”
用户 B 在第 3 个字符前插入 “World”

如果两个操作都直接应用到原始文本上，就会出现错误的结果（例如只保留其中一个插入）。OT 的作用就是把这两个“不兼容”的操作变成可以顺序执行且结果一致的操作序列。

🔍 核心目标

可交换性（Commutativity）：无论操作顺序如何，最终结果一致。
可还原性（Reversibility）：支持撤销操作。
一致性（Consistency）：所有副本最终收敛为相同状态。

二、ShareDB 是什么？

ShareDB 是一个基于 OT 的 JavaScript 实现，专为实时协作设计。它的核心思想是：

每个客户端记录自己的操作（如插入、删除），然后将这些操作发送给服务器；服务器负责协调这些操作，保证它们按正确的顺序合并到共享文档中。

它使用的是 CRDT（Conflict-free Replicated Data Type）+ OT 的混合策略，但本质上还是依赖 OT 来处理文本类操作。

三、案例模拟：多人同时插入文本的冲突场景

假设我们有一个简单的文本字段 "abc"，现在有两位用户同时插入新内容：

用户	操作描述	插入位置	插入内容
A	在索引 1 处插入	1	“X”
B	在索引 2 处插入	2	“Y”

原始文本："abc"

期望结果："aXbYc"

但如果直接应用两个操作而不做转换，会发生什么？

❌ 直接应用（无 OT）的结果：

如果先执行 A → "aXbc"
再执行 B（插入位置仍是 2）→ "aXbYc"

✅ 正确！

但如果 B 的操作是在 A 执行之前发来的呢？

先执行 B → "abYc"
再执行 A（插入位置仍是 1）→ "aXbYc"

也 ✅ 正确！

看起来没问题？那是因为这个例子太简单了。下面我们看更复杂的场景。

四、真正的冲突：操作顺序影响结果时怎么办？

考虑以下情况：

用户	操作描述	插入位置	插入内容
A	在索引 0 插入	0	“A”
B	在索引 1 插入	1	“B”

原始文本："xyz"

如果两个操作并行到达服务器，服务器必须决定哪个先执行。

🤔 问题来了：

如果先执行 A：变成 "Axyz"，再执行 B（原位置 1）→ "ABxyz"
如果先执行 B：变成 "Bxyz"，再执行 A（原位置 0）→ "ABxyz"

结果一样？没错，这里也没问题。

但如果我们改成：

用户	操作描述	插入位置	插入内容
A	在索引 1 插入	1	“X”
B	在索引 1 插入	1	“Y”

原始文本："abc"

A 先执行 → "aXbc"
B 后执行（位置仍为 1）→ "aXYbc"

但如果 B 先执行 → "aYbc"
再执行 A（位置仍为 1）→ "aXYbc"

✅ 结果一致！

但是注意：这是理想情况。现实中，网络延迟、客户端本地缓存、操作丢失等情况会导致操作无法完全按预期顺序到达服务器。

这时候就需要 OT 算法介入了！

五、ShareDB 如何用 OT 解决这个问题？

💡 关键机制：操作转换函数（Transform Function）

ShareDB 使用一种称为 transform() 函数 的机制来调整操作之间的相对关系。

假设我们有两个操作：

opA: { insert: 'X', index: 1 }
opB: { insert: 'Y', index: 1 }

我们要计算 opB 是否需要“偏移”才能与 opA 正确合并。

// ShareDB 提供的 transform 函数签名
function transform(opA, opB, type) {
  // 返回 [newOpA, newOpB]，表示经过转换后的两个操作
}

对于上述插入操作，ShareDB 内部会这样处理：

const opA = { insert: 'X', index: 1 };
const opB = { insert: 'Y', index: 1 };

// ShareDB 自动调用 transform
const [newOpA, newOpB] = sharedb.transform(opA, opB);

console.log(newOpA); // { insert: 'X', index: 1 }
console.log(newOpB); // { insert: 'Y', index: 2 } ← 注意：index +1！

为什么 newOpB.index === 2？

因为当 opA 在 index=1 插入了一个字符后，原本 index=1 的位置变成了 index=2。所以为了让 opB 能正确插入到原来的位置，它必须向右移动一位。

这就是 OT 的精髓：自动感知其他操作带来的偏移，动态调整自身操作的位置或参数。

六、完整代码示例：ShareDB 处理并发插入

下面是一个最小化的 Node.js 示例，展示 ShareDB 是如何处理两个用户同时插入文本的冲突。

✅ 安装依赖

npm install sharedb

🧪 示例代码：server.js

const ShareDB = require('sharedb');
const WebSocket = require('ws');

// 创建连接池
const backend = new ShareDB.MemoryBackend();
const connection = new ShareDB.Connection(backend);

// 创建文档
const doc = connection.get('test', 'example');

// 监听文档变化
doc.on('op', (ops) => {
  console.log('Document updated:', ops);
});

// 模拟两个用户并发插入
setTimeout(() => {
  const opA = { insert: 'X', index: 1 };
  doc.submitOp(opA);
}, 100);

setTimeout(() => {
  const opB = { insert: 'Y', index: 1 };
  doc.submitOp(opB);
}, 150);

// 启动后查看日志输出
console.log('Waiting for operations...');

运行此脚本后，你会看到类似如下输出：

Document updated: [{ insert: 'X', index: 1 }]
Document updated: [{ insert: 'Y', index: 2 }]  // 注意 index 变成了 2！

最终文档内容将是 "aXYbc"（假设原始是 "abc"），说明 OT 成功解决了冲突！

七、OT 的底层逻辑详解（伪代码）

为了让大家理解背后的数学原理，我们给出一个简化版的 transform() 函数实现（仅针对插入操作）：

function transformInsert(opA, opB) {
  const { index: idxA, insert: valA } = opA;
  const { index: idxB, insert: valB } = opB;

  if (idxA < idxB) {
    // opA 发生在 opB 前面，不影响 opB 的索引
    return [opA, opB];
  } else if (idxA > idxB) {
    // opA 发生在 opB 后面，但插入了字符，导致 opB 的索引偏移
    return [opA, { ...opB, index: idxB + 1 }];
  } else {
    // 同一位置插入，需要特殊处理（通常认为是覆盖或合并）
    return [opA, { ...opB, index: idxB + 1 }];
  }
}

这个函数就是 ShareDB 中 transform 函数的核心逻辑之一。

⚠️ 实际 OT 更复杂，还涉及删除、替换、合并等操作，以及嵌套结构（如 JSON 文档）。但插入是最基础也是最常见的场景。

八、表格总结：ShareDB OT 处理不同操作类型的方式

操作类型	是否影响后续操作	ShareDB 如何处理	示例
插入（insert）	✅ 是	自动偏移后续操作的 index	`"aXb"` → 插入 Y at index=1 → 实际变为 index=2
删除（del）	✅ 是	调整后续操作的 index	删除字符后，原位置之后的内容左移
替换（replace）	✅ 是	类似于 delete + insert	保持整体长度不变，但可能引发连锁偏移
多层嵌套（JSON）	✅ 是	使用路径跟踪 + 操作转换	支持数组、对象的局部更新

这些机制共同构成了 ShareDB 的强大之处：它可以处理任意复杂的文档结构，而不仅仅是纯文本。

九、常见误区澄清

❌ 误解 1：“只要用 CRDT 就不用 OT”

虽然 CRDT（如 G-Counter、LWW-Element）也可以解决并发问题，但它更适合状态同步而非细粒度操作。OT 更适合像文档编辑这种需要精确控制每一步操作的场景。

❌ 误解 2：“我可以用乐观锁解决”

乐观锁（如版本号）只能防止脏写，不能解决“操作之间相互干扰”的问题。比如两个用户都在第 5 位插入，版本号相同也无法判断谁该优先。

✅ 正解：OT 是专门为此类场景设计的解决方案，它不是替代方案，而是最佳实践。

十、结语：为什么 OT 在现代协作工具中不可或缺？

当我们使用 Google Docs、腾讯文档、Notion 等工具时，背后都有类似的 OT 或 CRDT 技术支撑。ShareDB 作为一个成熟的开源库，为我们提供了开箱即用的能力。

掌握 OT 不仅能帮助你在项目中构建真正的多人协作功能，还能让你深刻理解分布式系统的一致性难题。

记住一句话：

“不是所有的并发都是坏事，关键是你要知道怎么让它变得有序。”

希望这篇文章帮你打通了从理论到实践的认知闭环。如果你正在开发一个协作编辑器，不妨试试 ShareDB —— 它会让你少走很多弯路。

📌 参考资料

ShareDB 官方文档
“Operational Transformation in Practice” – by IBM Research
“The Art of Computer Programming, Volume 1” by Donald Knuth（关于串操作的经典）

欢迎留言交流你的 OT 实战经验！