MySQL高级讲座篇之：`Group Replication`的`Single Primary`和`Multi-Primary`模式：如何选择？ - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

各位观众老爷，大家好！我是你们的老朋友，今天咱们来聊聊MySQL Group Replication里的两位主角：Single Primary和Multi-Primary。这俩家伙长得挺像，都是用来搞数据复制、保证高可用性的，但脾气秉性却大相径庭。今天咱们就来扒一扒他们的底裤，看看在什么场合下该选哪个。

Group Replication是个啥玩意？

在正式开讲之前，先简单回顾一下Group Replication。它是一种MySQL的高可用方案，通过维护一个数据库服务器组，让数据在组内自动复制，从而实现故障自动切换和数据一致性。你可以把它想象成一个数据共享的“朋友圈”，任何一个人修改了数据，都会自动同步给其他人。

Single Primary：一夫当关，万夫莫开

Single Primary模式，顾名思义，就是整个Group里只有一个“老大”，负责处理所有的写操作。其他的节点都是“小弟”，只能读数据，不能写。

工作原理：
1. 所有写操作都必须发往Primary节点。
2. Primary节点将数据变更广播给Group内的其他Secondary节点。
3. Secondary节点接收到数据变更后，应用到本地。
4. Primary节点在确认数据变更已经同步到足够多的Secondary节点后（多数派），才向客户端确认写操作完成。
优点：
- 简单易懂： 架构简单，容易理解和维护。
- 数据一致性强： 由于只有一个写入口，避免了写冲突，保证了数据的一致性。
- 适用于读多写少的场景： 大部分请求都是读操作，只有少量写操作需要集中处理。
缺点：
- 单点故障风险： 如果Primary节点挂了，整个Group的写操作就瘫痪了，需要进行故障切换。
- 写性能瓶颈： 所有写操作都集中在Primary节点，可能成为性能瓶颈。
适用场景：
- 对数据一致性要求极高，不能容忍任何写冲突的场景。
- 读多写少的应用，例如电商平台的商品浏览、新闻网站的文章阅读等。
- 对写入性能要求不高的场景。
配置示例：
```
-- 在所有节点上设置
SET GLOBAL group_replication_group_name = 'my_group';
SET GLOBAL group_replication_communication_stack = 'xcom';
SET GLOBAL group_replication_single_primary_mode = ON;

-- 在其中一个节点上设置为Primary
SET GLOBAL group_replication_bootstrap_group = ON;
START GROUP_REPLICATION;
SET GLOBAL group_replication_bootstrap_group = OFF;
```
代码解释：
- group_replication_group_name: 指定Group的名称。
- group_replication_communication_stack: 指定通信协议，一般使用xcom。
- group_replication_single_primary_mode: 设置为ON表示启用Single Primary模式。
- group_replication_bootstrap_group: 仅在第一个节点上设置为ON，用于初始化Group。
- START GROUP_REPLICATION: 启动Group Replication。
注意：
- 在Single Primary模式下，只有一个节点可以执行写操作。
- 可以使用SHOW GLOBAL STATUS LIKE 'group_replication_member_state'; 命令查看节点状态。ONLINE表示节点正常运行，RECOVERING表示节点正在恢复。
- 可以使用 SHOW GLOBAL STATUS LIKE 'group_replication_primary_member'; 查看当前的Primary节点。

Multi-Primary：八仙过海，各显神通

Multi-Primary模式，顾名思义，就是整个Group里有多个“老大”，每个节点都可以处理写操作。

工作原理：
1. 客户端可以将写操作发往Group内的任何一个节点。
2. 接收到写操作的节点将数据变更广播给Group内的其他节点。
3. 其他节点接收到数据变更后，应用到本地。
4. 如果多个节点同时修改了同一行数据，Group Replication会使用冲突检测机制来解决冲突。
5. Group Replication 会使用分布式事务协议来保证最终一致性。
优点：
- 高可用性： 任何节点都可以处理写操作，即使某个节点挂了，其他节点仍然可以继续提供服务。
- 写性能扩展性： 可以通过增加节点来提高写性能。
- 低延迟： 客户端可以选择就近的节点进行写操作，降低延迟。
缺点：
- 数据冲突风险： 多个节点可以同时修改同一行数据，可能导致数据冲突。
- 复杂性高： 需要处理数据冲突和分布式事务，架构复杂，维护成本高。
- 不适用于所有场景： 不适用于对数据一致性要求极高，不能容忍任何写冲突的场景。
适用场景：
- 对可用性要求极高，需要保证服务持续运行的场景。
- 写负载较高的应用，例如IM聊天、游戏等。
- 能够容忍一定程度的数据冲突的场景。
配置示例：
```
-- 在所有节点上设置
SET GLOBAL group_replication_group_name = 'my_group';
SET GLOBAL group_replication_communication_stack = 'xcom';
SET GLOBAL group_replication_single_primary_mode = OFF;
SET GLOBAL group_replication_enforce_update_everywhere_checks = ON;

-- 在其中一个节点上设置为Primary
SET GLOBAL group_replication_bootstrap_group = ON;
START GROUP_REPLICATION;
SET GLOBAL group_replication_bootstrap_group = OFF;
```
代码解释：
- group_replication_single_primary_mode: 设置为OFF表示启用Multi-Primary模式。
- group_replication_enforce_update_everywhere_checks: 启用冲突检测机制，确保数据一致性。
注意：
- 在Multi-Primary模式下，所有节点都可以执行写操作。
- 需要仔细考虑数据冲突的处理策略，例如使用乐观锁、悲观锁等。
- 可以使用SHOW GLOBAL STATUS LIKE 'group_replication_flow_control_current_permits'; 查看当前流量控制情况。

冲突解决：亡羊补牢，犹未晚矣

既然Multi-Primary模式有数据冲突的风险，那该怎么办呢？别慌，Group Replication提供了冲突检测和解决机制。

冲突检测：

Group Replication会在每个节点上记录数据的版本信息，当多个节点同时修改同一行数据时，会检测到版本冲突。
冲突解决：

Group Replication提供了多种冲突解决策略：
- Last-Write-Wins (LWW): 以最后写入的数据为准，覆盖之前的数据。
  - 简单粗暴，但可能会导致数据丢失。
- First-Write-Wins (FWW): 以第一次写入的数据为准，忽略之后的数据。
  - 可以避免数据丢失，但可能会导致数据不一致。
- 自定义冲突解决策略： 可以编写自定义的冲突解决逻辑，根据具体的业务场景来处理冲突。
  - 灵活性最高，但需要投入更多精力进行开发和维护。
代码示例 (自定义冲突解决策略):

假设我们有一个orders表，记录订单信息，其中order_id是主键，status表示订单状态。我们需要实现一个自定义的冲突解决策略，如果两个节点同时修改了同一订单的状态，以状态值较大的为准。
```
-- 创建一个存储过程，用于解决冲突
DELIMITER //
CREATE PROCEDURE resolve_order_conflict(
    IN p_order_id INT,
    IN p_status_1 INT,
    IN p_status_2 INT,
    OUT p_resolved_status INT
)
BEGIN
    IF p_status_1 > p_status_2 THEN
        SET p_resolved_status = p_status_1;
    ELSE
        SET p_resolved_status = p_status_2;
    END IF;
END //
DELIMITER ;

-- 修改group_replication_conflict_resolution_policy变量，指定冲突解决策略
SET GLOBAL group_replication_conflict_resolution_policy = 'CUSTOM';

-- 修改group_replication_custom_conflict_resolution_procedure变量，指定自定义的存储过程
SET GLOBAL group_replication_custom_conflict_resolution_procedure = 'resolve_order_conflict';
```
代码解释：
- resolve_order_conflict: 自定义的存储过程，用于解决orders表的订单状态冲突。
- group_replication_conflict_resolution_policy: 设置为CUSTOM表示使用自定义的冲突解决策略。
- group_replication_custom_conflict_resolution_procedure: 指定自定义的存储过程。
注意：
- 自定义冲突解决策略需要根据具体的业务场景来编写。
- 需要仔细测试自定义冲突解决策略，确保其能够正确处理各种冲突情况。

脑筋急转弯：如何选择？

说了这么多，到底该选Single Primary还是Multi-Primary呢？别急，我来给你总结一下：

特性	Single Primary	Multi-Primary
架构	简单	复杂
数据一致性	强	弱 (需要处理冲突)
可用性	较低 (单点故障风险)	高
写性能	较低 (单点写瓶颈)	高 (可扩展)
复杂性	低	高
适用场景	读多写少，数据一致性要求极高	写负载高，对可用性要求极高，可容忍一定程度的数据冲突
冲突解决	无需	需要

举个栗子：

场景1： 电商平台的商品浏览系统，大部分请求都是读操作，只有少量商品信息更新操作。
- 选择： Single Primary。
场景2： IM聊天系统，需要保证消息的实时性和高可用性，但可以容忍极少数的消息顺序错乱。
- 选择： Multi-Primary。

总结：

选择Single Primary还是Multi-Primary，需要根据具体的业务场景来决定。没有绝对的好坏，只有最合适的选择。

如果你对数据一致性要求极高，不能容忍任何写冲突，那就选择Single Primary。
如果你对可用性要求极高，需要保证服务持续运行，并且能够容忍一定程度的数据冲突，那就选择Multi-Primary。

希望今天的讲座能帮助你更好地理解MySQL Group Replication的Single Primary和Multi-Primary模式，并在实际应用中做出正确的选择。

各位，下课！记得点赞收藏加关注哦！

发表回复 取消回复

发表回复取消回复