无盘复制（Diskless Replication）在 Master-Replica 中的应用 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

好的，各位听众，欢迎来到今天的“大师兄带你飞”系列讲座！今天我们要聊一个听起来高深莫测，实际上简单易懂，而且在数据库领域超级实用的话题——无盘复制（Diskless Replication）在 Master-Replica 架构中的应用。

准备好了吗？让我们一起揭开它的神秘面纱！🚀

一、啥是 Master-Replica 架构？（来个通俗易懂的介绍）

首先，我们来复习一下Master-Replica架构。你可以把它想象成一个公司，Master就像是老板，掌握着公司所有的核心数据和业务逻辑，所有的修改和更新都必须经过老板的手。而Replica就像是老板的秘书，时刻同步老板的资料，老板做什么，秘书也做什么。

Master（主服务器）： 负责处理所有的写操作（增、删、改），是数据的权威来源。
Replica（从服务器）： 负责处理读操作，从Master同步数据，减轻Master的压力。

这种架构的好处多多：

读写分离： Master专心写，Replica专心读，互不干扰，提高效率。
负载均衡： 多个Replica分担读请求，降低Master的压力。
高可用性： Master挂了，可以快速切换到Replica，保证服务不中断。（这部分需要更复杂的配置和监控，我们今天先不深入）

来，给你们看个形象点的图：

+-----------------+      +-----------------+
|     Master      |----->|     Replica 1   |
| (Write, Primary) |      | (Read, Secondary)|
+-----------------+      +-----------------+
       |                  |
       |                  |
       v                  v
+-----------------+      +-----------------+
|  Binary Log     |      |     Replica 2   |
|  (记录所有操作) |----->| (Read, Secondary)|
+-----------------+      +-----------------+

二、无盘复制是啥？（别被名字吓到）

好了，现在主角登场了——无盘复制（Diskless Replication）。

听到“无盘”两个字，是不是有点懵？难道不用硬盘了吗？当然不是！硬盘还是要用的，只不过我们不通过常规的硬盘到硬盘的复制方式来同步数据，而是直接在内存中完成数据传输，然后再由Replica将数据写入硬盘。

传统的数据复制流程是这样的：

Master将数据写入硬盘。
Replica从Master的硬盘读取数据。
Replica将数据写入自己的硬盘。

无盘复制的流程是这样的：

Master将数据写入硬盘，同时将数据发送到Replica的内存中。
Replica直接从内存中读取数据。
Replica将数据写入自己的硬盘。

看出区别了吗？省去了Replica从Master硬盘读取数据的环节！ 🚀

三、无盘复制的优势（为啥要用它？）

那么，为啥要搞这么复杂呢？无盘复制到底有什么好处？

速度更快： 内存读写速度远高于硬盘读写速度。直接从内存复制数据，大大缩短了复制时间，降低了延迟。
减少Master的I/O压力： Replica不再需要从Master的硬盘读取数据，减轻了Master的I/O负担，让Master可以更专注于写操作。
降低网络带宽需求： 在某些特定情况下，尤其是在Master和Replica位于同一物理机的情况，可以避免不必要的网络传输。

可以这样理解：传统的复制方式就像是从一个仓库搬运货物到另一个仓库，需要经过装车、运输、卸车等环节。而无盘复制就像是直接从仓库的传送带上取货，省去了中间的运输环节，效率自然更高。

四、无盘复制的应用场景（哪些情况下适合用？）

那么，无盘复制适合在哪些场景下使用呢？

数据量大，复制延迟敏感的应用： 比如金融交易、实时监控等，对数据一致性和延迟要求非常高。
Master的I/O压力大的应用： 比如高并发写入的应用，Master需要专注于写操作，避免被读操作拖累。
Master和Replica位于同一机房，网络带宽充足的应用： 这种情况下，无盘复制可以充分发挥其速度优势。

五、无盘复制的实现原理（深入了解一下）

现在，我们来深入了解一下无盘复制的实现原理。

无盘复制的核心在于Master和Replica之间的内存数据传输。具体来说，Master会将需要复制的数据写入到一个特殊的内存区域（可以理解为一个缓冲区），然后Replica直接从这个内存区域读取数据。

为了保证数据的一致性和可靠性，无盘复制通常会结合以下技术：

WAL（Write-Ahead Logging）： Master在修改数据之前，先将修改操作写入到WAL日志中。这样，即使发生故障，也可以通过WAL日志恢复数据。
Binary Log： Master会将所有的修改操作记录到Binary Log中。Replica通过读取Binary Log来同步数据。
GTID（Global Transaction Identifier）： 为每个事务分配一个唯一的ID，保证事务的顺序性和一致性。

六、无盘复制的配置和使用（手把手教你）

好了，理论知识讲了一大堆，现在我们来点实际的。以MySQL为例，看看如何配置和使用无盘复制。

前提条件：

MySQL版本 >= 5.6
Master和Replica之间的网络连接正常

配置步骤：

Master配置：

在Master的my.cnf文件中，添加以下配置：
```
[mysqld]
log-bin=mysql-bin
server-id=1
enforce-gtid-consistency=ON
gtid-mode=ON
binlog-format=ROW
binlog-checksum=CRC32
sync_binlog=1
innodb_flush_log_at_trx_commit=1
```
- log-bin: 启用二进制日志。
- server-id: 设置Master的唯一ID。
- enforce-gtid-consistency和gtid-mode: 启用GTID。
- binlog-format: 设置二进制日志的格式为ROW（推荐）。
- binlog-checksum: 启用二进制日志的校验和。
- sync_binlog: 设置每次事务提交时，将二进制日志同步到磁盘。
- innodb_flush_log_at_trx_commit: 设置每次事务提交时，将InnoDB的日志刷新到磁盘。
Replica配置：

在Replica的my.cnf文件中，添加以下配置：
```
[mysqld]
server-id=2
enforce-gtid-consistency=ON
gtid-mode=ON
relay-log=relay-log
relay-log-index=relay-log.index
log_slave_updates=ON
read_only=ON
skip_slave_start=ON
```
- server-id: 设置Replica的唯一ID。
- enforce-gtid-consistency和gtid-mode: 启用GTID。
- relay-log和relay-log-index: 设置中继日志的名称和索引。
- log_slave_updates: 允许Replica记录从Master同步的数据。
- read_only: 设置Replica为只读模式。
- skip_slave_start: 禁用Replica启动时自动启动复制线程。
启动Master和Replica：
```
sudo systemctl restart mysqld
```

在Master上创建用于复制的用户：

CREATE USER 'repl'@'%' IDENTIFIED BY 'password';
GRANT REPLICATION SLAVE, REPLICATION CLIENT ON *.* TO 'repl'@'%';
FLUSH PRIVILEGES;

在Master上获取当前二进制日志的位置：
```
SHOW MASTER STATUS;
```
记录下File和Position的值。
在Replica上配置复制：
```
CHANGE MASTER TO
    MASTER_HOST='master_ip',
    MASTER_USER='repl',
    MASTER_PASSWORD='password',
    MASTER_LOG_FILE='binlog_file',
    MASTER_LOG_POS=binlog_position,
    MASTER_AUTO_POSITION=1,
    GET_MASTER_PUBLIC_KEY=1,
    MASTER_USE_GTID=current_pos;

START SLAVE;
```
- MASTER_HOST: Master的IP地址。
- MASTER_USER: 用于复制的用户名。
- MASTER_PASSWORD: 用于复制的密码。
- MASTER_LOG_FILE: Master的二进制日志文件名。
- MASTER_LOG_POS: Master的二进制日志位置。
- MASTER_AUTO_POSITION=1: 启用基于GTID的复制。
- GET_MASTER_PUBLIC_KEY=1: 获取Master的公钥（如果启用了SSL）。
- MASTER_USE_GTID=current_pos: 指定使用GTID进行复制。
检查复制状态：
```
SHOW SLAVE STATUSG
```
确认Slave_IO_Running和Slave_SQL_Running都为Yes。
配置无盘复制 (重点来了!)

在 MySQL 5.7.17 之后，可以使用 clone 插件来进行无盘复制。
- 在Master上安装 clone 插件
```
INSTALL PLUGIN clone SONAME 'clone.so';
```
- 在Master上执行clone
```
CLONE LOCAL DATA DIRECTORY = 'data_directory';
```
注意这里的 data_directory 是你的数据目录，比如 /var/lib/mysql。这一步会生成一个clone的文件，里面包含了Master的数据镜像。
- 将clone文件传输到 Replica (非常关键！)
这里传输的方式有很多种，比如可以使用 scp 命令。
```
scp /var/lib/mysql/clone/clone.xb root@replica_ip:/tmp
```
- 在Replica上停止 mysql 服务
```
sudo systemctl stop mysqld
```
- 在Replica上安装 clone 插件
```
INSTALL PLUGIN clone SONAME 'clone.so';
```
- 在Replica上进行clone
```
CLONE INSTANCE FROM 'root@master_ip:3306' IDENTIFIED BY 'password' DATA DIRECTORY = '/var/lib/mysql';
```
这里需要指定 Master 的 IP 地址，端口，用户名，密码，以及 Replica 的数据目录。
- 启动Replica上的 mysql 服务
```
sudo systemctl start mysqld
```
这样，就完成了无盘复制的配置。

七、无盘复制的注意事项（避免踩坑）

内存需求： 无盘复制需要占用一定的内存空间，需要根据数据量和并发量合理配置内存大小。
网络带宽： 无盘复制需要消耗一定的网络带宽，需要保证Master和Replica之间的网络连接稳定。
数据一致性： 无盘复制需要依赖WAL、Binary Log和GTID等技术来保证数据的一致性，需要正确配置这些参数。
监控： 需要对无盘复制进行监控，及时发现和解决问题。

八、总结（划重点啦！）

今天我们一起学习了无盘复制在Master-Replica架构中的应用。

无盘复制是一种更快、更高效的数据复制方式。
它通过内存数据传输，减少了Master的I/O压力，降低了延迟。
它适用于数据量大、复制延迟敏感的应用。
配置和使用无盘复制需要一定的技术知识，需要仔细阅读文档和进行测试。

希望今天的讲座对大家有所帮助！如果大家有什么问题，欢迎提问。

谢谢大家！ 🎉

发表回复 取消回复

发表回复取消回复