MySQL高级讲座篇之：`Semi-Synchronous Replication`的`Wait for All Slaves`机制如何保证数据一致性？ - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

各位观众老爷，大家好！今天咱们来聊聊MySQL半同步复制里那个“Wait for All Slaves”机制，看看它怎么保证咱们宝贵的数据不丢，不乱，稳稳当当。

开场白：数据一致性，比你的工资还重要！

数据这玩意儿，对咱们来说，比工资还重要！工资没了，还能再挣，数据没了，那可就麻烦大了。想象一下，银行的数据丢了，你的存款没了，那还得了？电商的数据丢了，你的订单没了，那还不得投诉到你怀疑人生？

所以，数据一致性，那可是数据库的命根子！MySQL的半同步复制，就是为了保证这个命根子，而“Wait for All Slaves”机制，则是半同步复制里的一把利剑。

什么是半同步复制？

在聊“Wait for All Slaves”之前，咱们先简单回顾一下半同步复制。它跟异步复制最大的区别在于：

异步复制： 主库写完数据就OK了，直接返回给客户端，至于从库有没有收到，啥时候收到，主库压根不管。就像你给朋友发微信，你发完就完事了，至于他啥时候看，那就是他的事儿了。
半同步复制： 主库写完数据后，至少要等一个从库收到并确认，才返回给客户端。就像你给朋友发微信，他必须回复“收到”，你才放心。

半同步复制，牺牲了一点点性能，换来了更高的数据安全性。

“Wait for All Slaves”：让所有从库都说“OK”！

OK，现在咱们进入正题。“Wait for All Slaves” 机制，顾名思义，就是主库要等到所有配置了该选项的从库都确认收到数据，才算事务提交成功。

默认情况下，半同步复制只需要一个从库确认即可。但开启rpl_semi_sync_wait_for_all_slaves参数后，就需要所有配置了该选项的从库确认。

“Wait for All Slaves”是如何保证数据一致性的？

它主要通过以下几个步骤来实现数据一致性的保证：

主库写入数据： 主库执行事务，将数据写入自己的binlog。
主库发送binlog： 主库将binlog发送给所有配置了半同步复制的从库。
从库接收并写入relay log： 从库接收到binlog，将其写入relay log。
从库确认： 从库将relay log的内容应用到自己的数据库，并向主库发送确认信息。
主库等待确认： 主库等待所有配置了rpl_semi_sync_wait_for_all_slaves的从库的确认信息。
主库提交事务： 只有收到所有从库的确认信息，主库才会提交事务，并返回给客户端。

代码示例：开启和配置半同步复制

-- 在主库上操作
INSTALL PLUGIN rpl_semi_sync_master SONAME 'semisync_master.so';
SET GLOBAL rpl_semi_sync_master_enabled = 1;
SET GLOBAL rpl_semi_sync_master_wait_for_slave_count = 2; -- 设置至少需要多少个从库确认 (默认值，可以根据实际情况调整)
SET GLOBAL rpl_semi_sync_master_timeout = 10; -- 设置等待从库确认的超时时间，单位是秒
SET GLOBAL rpl_semi_sync_wait_for_all_slaves = 1; -- 关键设置！开启 "Wait for All Slaves"

-- 在从库上操作
INSTALL PLUGIN rpl_semi_sync_slave SONAME 'semisync_slave.so';
SET GLOBAL rpl_semi_sync_slave_enabled = 1;

注意事项：

rpl_semi_sync_wait_for_all_slaves只对配置了半同步复制的从库生效。
如果某个从库挂了，主库会一直等待，直到超时。所以，rpl_semi_sync_master_timeout参数非常重要！
开启rpl_semi_sync_wait_for_all_slaves会显著增加主库的延迟，需要根据实际情况权衡。

“Wait for All Slaves”的优点和缺点

优点：

更高的数据一致性： 保证所有从库都收到数据，才能提交事务，最大程度地避免数据丢失和不一致。
适用于对数据一致性要求极高的场景： 例如，金融系统、核心业务系统等。

缺点：

更高的延迟： 主库需要等待所有从库的确认，增加了事务的响应时间。
可用性降低： 如果某个从库挂了，主库会一直等待，直到超时，影响系统的可用性。
配置复杂： 需要确保所有从库都配置正确，并且网络连接正常。

应用场景：哪些场景适合用“Wait for All Slaves”？

金融行业： 银行、证券等对数据一致性要求极高的行业。
核心业务系统： 交易系统、支付系统等对数据一致性要求极高的系统。
任何不能容忍数据丢失的场景： 例如，订单系统、库存系统等。

不适用场景：哪些场景不适合用“Wait for All Slaves”？

对延迟要求高的场景： 例如，高并发的Web应用、实时数据分析等。
从库数量多的场景： 从库越多，主库等待的时间越长，延迟越高。
网络环境不稳定的场景： 网络不稳定，从库确认时间会增加，影响主库的性能。

深入剖析：超时处理机制

前面提到了rpl_semi_sync_master_timeout参数，这个参数非常重要。如果主库在指定的时间内没有收到所有从库的确认信息，会发生什么呢？

默认情况下，主库会切换到异步复制模式。也就是说，之后的事务，主库就不再等待从库的确认了，直接提交。

代码示例：超时处理

-- 模拟从库挂掉的情况
-- 假设我们有两个从库，slave1 和 slave2
-- 现在我们故意让 slave2 停止复制

STOP SLAVE; -- 在 slave2 上执行

-- 然后在主库上执行一些事务

CREATE TABLE test_table (id INT PRIMARY KEY, value VARCHAR(255));
INSERT INTO test_table (id, value) VALUES (1, 'test data');

-- 由于 slave2 挂掉了，主库在 rpl_semi_sync_master_timeout 时间后，会切换到异步复制模式
-- 之后，即使 slave2 没有收到数据，主库也会提交事务

-- 恢复 slave2 的复制
START SLAVE; -- 在 slave2 上执行

重要的提示：

切换到异步复制模式后，数据一致性就无法保证了。
可以通过监控主库的状态变量，来判断是否发生了超时切换。

SHOW GLOBAL STATUS LIKE 'Rpl_semi_sync_master_no_tx'; -- 统计切换到异步复制模式的次数
SHOW GLOBAL STATUS LIKE 'Rpl_semi_sync_master_timeouts'; -- 统计半同步复制超时的次数

更高级的玩法：结合MGR（MySQL Group Replication）

如果对数据一致性有更高的要求，可以考虑将半同步复制和MGR结合起来使用。MGR是一种多主复制技术，可以实现更强的数据一致性和更高的可用性。

在这种架构下，可以将半同步复制作为MGR的辅助手段，进一步提高数据一致性。

总结：根据实际情况选择合适的复制方式

MySQL提供了多种复制方式，包括异步复制、半同步复制、MGR等。每种方式都有自己的优缺点，适用于不同的场景。

选择合适的复制方式，需要根据实际情况进行权衡。

复制方式	优点	缺点	适用场景
异步复制	性能高，延迟低	数据一致性无法保证，可能丢失数据	对数据一致性要求不高，但对性能要求高的场景，例如读多写少的Web应用
半同步复制	数据一致性比异步复制高，至少有一个从库保证收到数据	性能比异步复制低，延迟较高	对数据一致性有一定要求，但对性能要求不是特别高的场景，例如中小型企业的核心业务系统
半同步复制 + Wait for All Slaves	数据一致性最高，所有从库都保证收到数据	性能最低，延迟最高，可用性较低	对数据一致性要求极高，但对性能要求不高的场景，例如金融系统、银行系统，并且确保网络环境良好，从库数量不多
MGR	数据一致性最高，可用性最高	配置复杂，对硬件要求高，学习成本高	对数据一致性和可用性要求极高的场景，例如大型企业的核心业务系统

给点建议：

不要盲目追求高一致性： 高一致性往往意味着更高的延迟和更低的可用性。
监控是关键： 实时监控主库和从库的状态，及时发现问题并解决。
备份是最后的防线： 定期备份数据，以防万一。

结束语：

好了，今天的讲座就到这里。希望通过今天的讲解，大家对MySQL半同步复制的“Wait for All Slaves”机制有了更深入的了解。记住，选择合适的复制方式，才能让你的数据更安全，更可靠！

下次再见！

发表回复 取消回复

发表回复取消回复