MySQL高级讲座篇之：超越传统复制：GTID在数据库高可用架构中的革命性作用。 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

各位观众老爷，晚上好！我是你们的老朋友，今天咱们聊点刺激的——GTID，这玩意儿啊，就像给MySQL复制打了一针肾上腺素，让它在高可用架构里彻底翻身农奴把歌唱！

第一部分：传统复制的那些糟心事儿

在GTID出来之前，咱们的MySQL复制，那叫一个“手工作坊”式操作，各种问题层出不穷：

定位问题： “老板，主库崩了，从库在哪儿？” “呃…好像是binlog文件是mysql-bin.000123， position是1024…吧？” 别笑，这种场景太常见了，运维小哥们经常在半夜被吓醒。
切换痛苦： 主从切换，那简直就是一场噩梦，要手动找binlog位置，稍不留神就丢数据，或者复制中断。
新从库加入： 想加个新从库？先把主库数据dump一份，然后再从dump的位置开始复制。慢不说，还容易出错。

这些问题，归根结底，都是因为传统的复制方式依赖于binlog文件名和position，这玩意儿太脆弱了！

第二部分：GTID：数据库复制的GPS

GTID，全称Global Transaction Identifier，全局事务ID。你可以把它想象成每个事务的身份证号，全球唯一，童叟无欺。有了它，复制就变成了“按身份证号找人”，而不是“按住址找人”。

GTID的结构：

server_uuid:transaction_id
- server_uuid: 每个MySQL实例的唯一标识，就像你的身份证号上的地区码。
- transaction_id: 在这个实例上产生的事务的序列号，自增，就像你的身份证号上的出生日期和流水号。
GTID的好处：
- 自动定位： 从库可以自动找到主库上它需要复制的事务，再也不用手动指定binlog文件名和position了。
- 简化切换： 主从切换，只需要告诉新的主库，哪些GTID已经执行过了，剩下的它会自动补齐。
- 方便新从库加入： 新从库只需要告诉主库，它想从哪个GTID开始复制，主库会自动发送数据。
- 幂等性： 同一个GTID的事务，无论执行多少次，结果都一样，避免重复执行导致的数据错误。

第三部分：GTID实战演练：代码说话

光说不练假把式，接下来咱们来点真格的，看看GTID怎么用。

开启GTID：

修改my.cnf配置文件：

[mysqld]
gtid_mode = ON
enforce_gtid_consistency = ON
log_slave_updates = ON  # 从库也要记录binlog
server-id = 1 # 必须设置，且每个实例不同
log_bin = mysql-bin # 启用二进制日志
binlog_format = ROW # 推荐使用ROW格式

重启MySQL服务：
```
sudo systemctl restart mysql
```

登录MySQL，确认GTID已经开启：

mysql> SHOW GLOBAL VARIABLES LIKE 'gtid_mode';
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| gtid_mode     | ON    |
+---------------+-------+
1 row in set (0.00 sec)

创建用户并授权：

CREATE USER 'repl'@'%' IDENTIFIED BY 'your_password';
GRANT REPLICATION SLAVE, REPLICATION CLIENT ON *.* TO 'repl'@'%';
FLUSH PRIVILEGES;

配置从库：

获取主库的GTID集合：

mysql> SHOW MASTER STATUS;
+------------------+-----------+--------------+------------------+------------------------------------+
| File             | Position  | Binlog_Do_DB | Binlog_Ignore_DB | Executed_Gtid_Set                  |
+------------------+-----------+--------------+------------------+------------------------------------+
| mysql-bin.000001 |       156 |              |                  | 11111111-1111-1111-1111-111111111111:1-10 |
+------------------+-----------+--------------+------------------+------------------------------------+
1 row in set (0.00 sec)

记录下Executed_Gtid_Set的值，比如这里是11111111-1111-1111-1111-111111111111:1-10。

在从库上配置：

STOP SLAVE;
RESET SLAVE ALL;  # 注意：会清空所有复制信息，谨慎操作！
SET GLOBAL gtid_purged = '11111111-1111-1111-1111-111111111111:1-10'; # 设置从库已经执行过的GTID集合
CHANGE MASTER TO
    MASTER_HOST='your_master_host',
    MASTER_USER='repl',
    MASTER_PASSWORD='your_password',
    MASTER_AUTO_POSITION=1; # 开启自动定位
START SLAVE;

查看从库状态：
```
mysql> SHOW SLAVE STATUSG
...
Slave_IO_Running: Yes
Slave_SQL_Running: Yes
...
Last_IO_Errno: 0
Last_SQL_Errno: 0
...
```
如果Slave_IO_Running和Slave_SQL_Running都是Yes，并且Last_IO_Errno和Last_SQL_Errno都是0，那么恭喜你，复制配置成功了！

模拟主从切换：

假设主库挂了，我们需要把一个从库提升为主库。
1. 选择新的主库： 选择一个数据最新的从库。
2. 停止所有其他从库的复制：
```
STOP SLAVE;
```
3. 在新主库上执行：
```
RESET MASTER; # 清空新主库的master信息，使其成为一个独立的主库
```
4. 配置其他从库连接到新的主库：
```
STOP SLAVE;
RESET SLAVE ALL;
CHANGE MASTER TO
    MASTER_HOST='new_master_host',
    MASTER_USER='repl',
    MASTER_PASSWORD='your_password',
    MASTER_AUTO_POSITION=1;
START SLAVE;
```
整个过程，只需要简单的几条命令，再也不用手动找binlog位置了，是不是很爽？

第四部分：GTID的进阶玩法：多主复制与Group Replication

GTID不仅仅是简化了主从复制，它还为更高级的复制架构提供了基础。

多主复制（Multi-Master Replication）：

在多主复制架构中，多个MySQL实例都可以同时接受写操作，然后通过GTID将数据同步到其他节点。这种架构可以提高写入性能，但需要解决数据冲突的问题。
- 环状复制： 每个节点都作为其他节点的从库。这种方式配置简单，但容错性较差。
- 网状复制： 每个节点都作为多个节点的从库。这种方式容错性高，但配置复杂。
多主复制需要谨慎使用，需要仔细考虑数据冲突的解决方案，比如：
- 冲突检测： 在写入数据之前，先检测是否存在冲突。
- 冲突解决： 如果存在冲突，根据预定义的规则解决冲突，比如：
  - Last Write Wins： 最后写入的数据覆盖之前的数据。
  - 自定义逻辑： 根据业务逻辑解决冲突。
Group Replication：

Group Replication是MySQL官方提供的高可用解决方案，它基于GTID和Paxos协议，可以实现数据的一致性和自动故障转移。
- 单主模式： 只有一个节点可以接受写操作，其他节点作为只读副本。当主节点故障时，会自动选举新的主节点。
- 多主模式： 多个节点都可以接受写操作，但需要解决数据冲突的问题。
Group Replication的优点：
- 高可用性： 自动故障转移，保证服务的连续性。
- 数据一致性： 基于Paxos协议，保证数据的一致性。
- 易于管理： MySQL官方提供，易于部署和管理。
Group Replication的缺点：
- 性能开销： Paxos协议需要进行多轮投票，会增加性能开销。
- 网络要求： 需要良好的网络环境，避免网络延迟导致的问题。

第五部分：GTID的注意事项：踩坑指南

GTID虽然好用，但也有一些需要注意的地方，一不小心就会踩坑。

版本要求： MySQL 5.6.5及以上版本才支持GTID。
开启GTID之前： 务必备份数据！开启GTID是一个不可逆的过程，一旦开启，就很难再回到传统的复制方式了。
binlog格式： 推荐使用ROW格式，可以避免很多意想不到的问题。STATEMENT格式在某些情况下可能会导致GTID不一致。

gtid_mode的取值：

值	含义
OFF	禁用GTID
ON	启用GTID，允许创建和执行GTID事务，但不强制使用GTID
OFF_PERMISSIVE	新事务可以创建GTID事务或匿名事务，从库可以复制GTID事务或匿名事务。用于从ON状态过渡到OFF状态。
ON_PERMISSIVE	新事务可以创建GTID事务或匿名事务，从库必须复制GTID事务。用于从OFF状态过渡到ON状态。
OFF_STRICT	与OFF_PERMISSIVE类似，但如果存在匿名事务，则不允许将`gtid_mode`设置为OFF。
ON_STRICT	与ON_PERMISSIVE类似，但如果存在匿名事务，则不允许将`gtid_mode`设置为ON。而且，不允许创建匿名事务，所有事务都必须是GTID事务。

在生产环境中，建议使用ON_STRICT，强制使用GTID，避免出现匿名事务。

enforce_gtid_consistency的取值：

值含义

OFF 允许创建不安全的语句（例如CREATE TABLE ... SELECT，它可能导致主从数据不一致）。

ON 强制GTID一致性，不允许创建不安全的语句。

在生产环境中，务必设置为ON，保证GTID的一致性。
主键： 表必须有主键，否则ROW格式的binlog无法正常工作。
存储引擎： 建议使用InnoDB存储引擎，它对GTID的支持更好。
监控： 要密切关注GTID的状态，及时发现和解决问题。可以使用MySQL自带的监控工具，也可以使用第三方的监控工具。

值	含义
OFF	允许创建不安全的语句（例如`CREATE TABLE ... SELECT`，它可能导致主从数据不一致）。
ON	强制GTID一致性，不允许创建不安全的语句。

第六部分：GTID的未来：云原生时代的数据库高可用

随着云计算的普及，数据库也在向云原生方向发展。GTID作为数据库复制的基础，在云原生时代将发挥更大的作用。

自动化运维： 云平台可以利用GTID自动配置和管理数据库复制，减少人工干预。
弹性伸缩： 云平台可以根据业务负载自动调整数据库的规模，GTID可以保证数据的一致性。
跨云复制： GTID可以实现跨云平台的数据库复制，提高数据的可靠性和可用性。

总之，GTID是数据库复制领域的一项重要技术，它简化了复制配置，提高了数据库的可用性和可靠性，为数据库在高可用架构中发挥更大的作用奠定了基础。

第七部分：总结与展望

今天咱们从传统复制的痛点出发，一路聊到GTID的原理、实战、进阶玩法以及注意事项，最后展望了GTID在云原生时代的未来。希望大家能对GTID有一个更深入的了解。

记住，GTID不是万能的，它只是一个工具，关键在于如何正确使用它。

最后，祝大家都能成为GTID高手，轻松应对各种数据库高可用场景！

今天的讲座就到这里，谢谢大家！

（鞠躬，下台）

发表回复 取消回复

发表回复取消回复