分布式事务模式：Saga 模式与最终一致性 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

好的，各位观众老爷们，大家好！我是你们的老朋友，江湖人称“代码界的段子手”的程序员老王。今天咱们不聊996，也不聊秃头，咱们来聊点高大上的——分布式事务。

啥？分布式事务？听起来是不是像量子力学一样晦涩难懂？别怕！今天老王就用最接地气的方式，带大家走进分布式事务的世界，特别是其中的Saga模式和最终一致性。保证你听完之后，不仅能明白，还能出去跟人吹牛皮！😎

开场白：单身狗的烦恼与分布式事务的相似之处

话说，单身狗最大的烦恼是什么？当然是找不到对象啊！你想想，如果有个姑娘跟你表白，你答应了，结果发现她有个奇葩的闺蜜团，非要你也满足她们的要求，才能顺利结婚。

闺蜜A：你要在北京二环买套房！
闺蜜B：彩礼必须88万！
闺蜜C：婚后工资全上交！

你一看，卧槽，这条件也太苛刻了吧！如果有一个条件满足不了，那是不是就完犊子了？这就像传统的ACID事务，要么全部成功，要么全部失败。

但是，如果你学会了Saga模式，情况就大不一样了！你可以跟姑娘说：“亲爱的，我尽力满足你闺蜜的要求，如果实在不行，咱们可以一步一步来，实在不行就退一步，重新来过嘛！”

看到没？这就是Saga模式的核心思想：化整为零，逐步推进，失败了就补偿。

第一章：分布式事务的“前世今生”

在单体应用时代，数据库的ACID特性就像一个可靠的老管家，保证了数据的一致性。但是，随着业务的快速发展，单体应用逐渐演变成了分布式系统，数据也被分散到了不同的服务和数据库中。

这时候，老管家就有点力不从心了。想象一下，你要跨多个银行账户转账，如果其中一个银行的服务器宕机了，那整个转账操作就会失败，数据就可能出现不一致。

这就是分布式事务面临的挑战：如何在多个服务之间保证数据的一致性？

第二章：ACID的“理想很丰满，现实很骨感”

咱们先来回顾一下ACID这四个字母代表的含义：

A (Atomicity)： 原子性，要么全部成功，要么全部失败。
C (Consistency)： 一致性，事务执行前后，数据必须处于一致的状态。
I (Isolation)： 隔离性，多个事务并发执行时，互不干扰。
D (Durability)： 持久性，事务一旦提交，数据就永久保存。

在单体应用中，ACID特性是由数据库来保证的。但是在分布式系统中，要实现ACID就变得非常困难。

性能瓶颈： 为了保证原子性和隔离性，需要使用分布式锁等机制，这会大大降低系统的并发性能。
复杂度高： 实现分布式ACID事务需要复杂的协议，例如两阶段提交（2PC）和三阶段提交（3PC），这会增加系统的开发和维护成本。
可用性差： 如果参与事务的任何一个服务宕机，整个事务就会失败，这会降低系统的可用性。

因此，在很多场景下，我们不得不放弃强一致性，转而追求最终一致性。

第三章：Saga模式：分布式事务的“救星”

Saga模式是一种解决分布式事务问题的常用方案。它将一个大的事务分解成一系列小的本地事务，每个本地事务只更新自己服务的数据。如果其中一个本地事务失败，Saga模式会执行一系列的补偿事务，撤销之前已经执行的本地事务。

可以把Saga模式想象成一个“亡羊补牢”的过程。🐑丢了，赶紧把漏洞补上，尽量减少损失。

Saga模式的两种实现方式：

编排式Saga (Orchestration-based Saga)： 由一个中心协调器（Saga Orchestrator）来协调各个参与者（Participant）的事务。协调器负责决定执行哪个事务，以及在事务失败时执行哪个补偿事务。
协同式Saga (Choreography-based Saga)： 各个参与者通过事件进行通信，每个参与者监听其他参与者发出的事件，并根据事件执行相应的事务或补偿事务。

两种模式的对比：

特性	编排式Saga	协同式Saga
协调者	中心协调器	无中心协调器
通信方式	协调器与参与者之间直接通信	参与者之间通过事件总线进行通信
复杂度	协调器逻辑复杂，参与者逻辑简单	参与者逻辑复杂，协调逻辑简单
可维护性	协调器集中管理，易于维护	参与者之间依赖关系复杂，难以维护
适用场景	流程复杂，参与者较多的场景	流程简单，参与者较少的场景
优点	集中控制，易于理解和调试；更容易处理复杂的业务逻辑	服务间解耦，更灵活；易于扩展新的服务
缺点	协调器成为单点故障；协调器逻辑过于复杂	服务间依赖隐式，难以理解和调试；可能出现循环依赖

举个栗子：电商下单流程

假设一个电商下单流程涉及到以下几个服务：

订单服务： 创建订单。
库存服务： 扣减库存。
支付服务： 扣款。
物流服务： 创建物流单。

如果使用Saga模式，可以这样实现：

订单服务： 创建订单，并发布“订单已创建”事件。
库存服务： 监听“订单已创建”事件，扣减库存。如果库存不足，则发布“库存扣减失败”事件。
支付服务： 监听“订单已创建”事件，扣款。如果扣款失败，则发布“支付失败”事件。
物流服务： 监听“订单已创建”事件，创建物流单。
订单服务： 如果收到“库存扣减失败”或“支付失败”事件，则执行补偿事务，取消订单。
库存服务： 如果订单取消，则执行补偿事务，恢复库存。
支付服务： 如果订单取消，则执行补偿事务，退款。
物流服务： 如果订单取消，则执行补偿事务，取消物流单。

Saga模式的优点：

最终一致性： 保证数据最终达到一致状态。
高可用性： 部分服务宕机不会影响整个流程。
高性能： 避免了分布式锁的使用，提高了并发性能。

Saga模式的缺点：

复杂度高： 需要设计补偿事务，增加了开发和维护成本。
数据不一致： 在事务执行过程中，数据可能处于不一致的状态。
幂等性： 需要保证本地事务和补偿事务的幂等性，避免重复执行。

第四章：最终一致性：退一步海阔天空

最终一致性是指系统中的数据在经过一段时间后，最终能够达到一致的状态，但不需要保证实时一致性。

可以把最终一致性想象成“亡羊补牢，犹未晚也”。虽然羊丢了，但是只要及时把漏洞补上，最终还是可以避免更大的损失。

最终一致性的几种实现方式：

可靠消息队列： 服务之间通过消息队列进行通信，保证消息的可靠传递。如果消息发送失败，可以进行重试。
定时任务： 定时扫描数据，发现不一致的数据，进行修复。
补偿事务： 在事务失败时，执行补偿事务，撤销之前已经执行的事务。

最终一致性的适用场景：

对实时性要求不高的场景： 例如，用户注册、订单支付等。
允许数据短暂不一致的场景： 例如，商品库存、用户积分等。

第五章：Saga模式与最终一致性的“爱恨情仇”

Saga模式是实现最终一致性的一种常用手段。通过将一个大的事务分解成一系列小的本地事务，并使用补偿事务来处理失败的情况，Saga模式可以保证数据最终达到一致的状态。

可以说，Saga模式是最终一致性的“好基友”，它们互相配合，共同维护分布式系统的数据一致性。

第六章：Saga模式的“坑”与“填坑指南”

Saga模式虽然好用，但是也存在一些坑，需要我们注意。

幂等性问题： 如何保证本地事务和补偿事务的幂等性？
- 解决方案： 使用唯一ID来标识每个事务，并记录事务的执行状态。在执行事务之前，先检查事务是否已经执行过，如果已经执行过，则直接返回成功。
数据不一致问题： 如何处理事务执行过程中出现的数据不一致？
- 解决方案： 尽量避免长事务，减少数据不一致的时间窗口。可以使用读写分离、数据快照等技术来降低数据不一致的影响。
循环依赖问题： 在协同式Saga模式中，如何避免循环依赖？
- 解决方案： 尽量避免双向依赖，可以使用事件溯源等技术来解耦服务之间的依赖关系。
补偿事务的复杂性： 如何设计有效的补偿事务？
- 解决方案： 尽量将事务设计得简单，避免复杂的业务逻辑。可以使用状态机等技术来管理补偿事务的流程。

第七章：总结：分布式事务的“葵花宝典”

今天，我们一起学习了分布式事务的Saga模式和最终一致性。希望大家能够记住以下几点：

分布式事务是解决分布式系统中数据一致性问题的关键。
ACID事务在分布式系统中面临性能、复杂度和可用性等挑战。
Saga模式是一种解决分布式事务问题的常用方案，它将一个大的事务分解成一系列小的本地事务，并使用补偿事务来处理失败的情况。
最终一致性是指系统中的数据在经过一段时间后，最终能够达到一致的状态，但不需要保证实时一致性。
Saga模式是实现最终一致性的一种常用手段。

掌握了这些知识，你就可以在分布式事务的世界里“横行霸道”了！当然，学习永无止境，希望大家能够继续深入学习，不断提升自己的技术水平。

最后的彩蛋：

记住，代码写得好不好不重要，重要的是能把代码讲清楚！😎

好啦，今天的分享就到这里，感谢大家的观看！如果觉得我的分享对你有帮助，记得点赞、评论、转发哦！我们下期再见！👋

发表回复 取消回复

发表回复取消回复