MySQL高阶讲座之：`InnoDB`的双写缓冲区`Double Write`源码解析：如何实现崩溃恢复的原子性。 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

咳咳，麦克风试音，一二三，一二三… 各位观众老爷们，欢迎来到MySQL高阶讲座现场！今天咱们聊点硬核的，扒一扒InnoDB的“双写缓冲区Double Write”，看看它如何保证崩溃恢复的原子性，让你的数据在断电、宕机的情况下也能安然无恙。

开场白：数据，你的小宝贝，不能说没就没！

在数据库的世界里，数据就是你的命根子。想象一下，辛辛苦苦攒了一堆数据，结果服务器突然崩了，数据丢了一半，那感觉，比失恋还难受！所以，保证数据的完整性，那可是重中之重。

InnoDB作为MySQL默认的存储引擎，在这方面下了不少功夫。其中，Double Write就是它保护数据的一大利器。简单来说，Double Write就像给你的数据加了一层“保险锁”，即使在写入过程中发生崩溃，也能通过它来恢复数据，保证原子性。

正文：Double Write工作原理大揭秘

那么，Double Write到底是怎么工作的呢？咱们先来捋一捋InnoDB写入数据的流程：

脏页产生： 当你修改了数据页（Page）后，这个页就变成了“脏页”，需要被刷回磁盘。
写入Double Write缓冲区： 在将脏页刷回数据文件之前，InnoDB会先将这个页的内容拷贝一份到Double Write缓冲区。
写入数据文件： 然后，InnoDB才会将脏页写入到实际的数据文件中。
写入完成： 写入完成后，一切OK，数据安全了。

听起来好像也没什么特别的？别急，重点就在于第二步。咱们来画个图（虽然我不能真的画，但你可以脑补一下）：

+---------------------+      +---------------------+      +---------------------+
|     脏页 (Dirty Page)     | --> |  Double Write Buffer  | --> |    数据文件 (Data File)     |
+---------------------+      +---------------------+      +---------------------+
|  内存中的待刷盘数据页  |      |  磁盘上的临时备份区域  |      |   磁盘上的实际存储区域   |
+---------------------+      +---------------------+      +---------------------+

Double Write缓冲区是个啥？

Double Write缓冲区位于系统的共享表空间（System Tablespace）中，它由两个连续的区域组成，每个区域的大小通常是2MB。也就是说，Double Write缓冲区的大小是4MB。

为什么需要Double Write？

你可能会问，直接写数据文件不行吗？为什么要多此一举，先写到Double Write缓冲区？

这是因为，在实际的写入过程中，可能会发生“部分写失效”（Partial Write）的情况。

什么是“部分写失效”？

简单来说，就是操作系统在写入数据页的时候，可能只写了一部分就崩溃了。比如，一个数据页的大小是16KB，但是操作系统可能只写了8KB就挂了。这样，数据页就损坏了，无法恢复。

Double Write如何解决“部分写失效”？

完整性保证： Double Write缓冲区保证了即使发生“部分写失效”，也有一个完整的备份。
恢复流程： 在系统恢复时，InnoDB会检查数据页的完整性。如果发现数据页损坏，就会从Double Write缓冲区中恢复数据。

Double Write的恢复流程

启动恢复： 数据库启动时，会进行崩溃恢复。
检查数据页： InnoDB会检查每个数据页的校验和（Checksum）。如果校验和不匹配，说明数据页可能损坏。
从Double Write恢复： 如果数据页损坏，InnoDB会查找对应的Double Write缓冲区中的备份。
应用备份： 如果找到了备份，InnoDB会将备份的数据页拷贝到数据文件中，覆盖损坏的数据页。
恢复完成： 这样，就完成了数据页的恢复，保证了数据的完整性。

Double Write的源码解析

光说不练假把式，咱们来看点InnoDB的源码，深入了解Double Write的实现细节。

由于篇幅限制，这里不可能把所有代码都贴出来，咱们只挑一些关键的部分来分析。

首先，我们来看看Double Write缓冲区的定义：

// 在ibdata1文件中预留的doublewrite buffer空间
struct doublewrite {
  ulint   page_no1;     // doublewrite page number 1
  ulint   page_no2;     // doublewrite page number 2
  byte    buf[16384];   // 一个page的数据
}

这段代码定义了doublewrite结构体，其中包括了两个页号（page_no1和page_no2）和一个缓冲区（buf）。这个缓冲区用于存储数据页的内容。

接下来，我们来看看InnoDB如何将脏页写入Double Write缓冲区：

// 将一个page写入到doublewrite buffer
dberr_t doublewrite_write_page(
    buf_page_t* page,   /*!< in: page to write */
    ulint       space_id, /*!< in: space id */
    ulint       page_no,  /*!< in: page number */
    ulint       offset)   /*!< in: offset in the doublewrite buffer */
{
  // 1. 获取doublewrite buffer的地址
  byte* dw_buf = doublewrite_get_buf(offset);

  // 2. 将page的数据拷贝到doublewrite buffer
  memcpy(dw_buf, page->data, UNIV_PAGE_SIZE);

  // 3. 将doublewrite buffer中的数据写入磁盘
  // ... (省略了实际的写入操作)

  return(DB_SUCCESS);
}

这段代码展示了doublewrite_write_page函数，它负责将一个数据页写入到Double Write缓冲区。它的主要步骤包括：

获取Double Write缓冲区地址： 通过doublewrite_get_buf函数获取Double Write缓冲区中指定偏移量的地址。
拷贝数据： 使用memcpy函数将数据页的内容拷贝到Double Write缓冲区。
写入磁盘： 将Double Write缓冲区中的数据写入磁盘。

最后，我们来看看InnoDB如何从Double Write缓冲区恢复数据页：

// 从doublewrite buffer中读取一个page
dberr_t doublewrite_read_page(
    byte*       buf,      /*!< out: buffer to read into */
    ulint       space_id, /*!< in: space id */
    ulint       page_no,  /*!< in: page number */
    ulint       offset)   /*!< in: offset in the doublewrite buffer */
{
  // 1. 获取doublewrite buffer的地址
  byte* dw_buf = doublewrite_get_buf(offset);

  // 2. 从doublewrite buffer中读取数据
  memcpy(buf, dw_buf, UNIV_PAGE_SIZE);

  return(DB_SUCCESS);
}

这段代码展示了doublewrite_read_page函数，它负责从Double Write缓冲区读取数据页。它的主要步骤包括：

获取Double Write缓冲区地址： 通过doublewrite_get_buf函数获取Double Write缓冲区中指定偏移量的地址。
读取数据： 使用memcpy函数从Double Write缓冲区读取数据，并将其拷贝到指定的缓冲区。

Double Write的优缺点

任何技术都有其优缺点，Double Write也不例外。

优点：

数据完整性： 保证了即使发生“部分写失效”，也能恢复数据，保证数据的完整性。
简单有效： 实现简单，效果显著，是一种非常有效的崩溃恢复机制。

缺点：

性能损耗： 每次写入都需要先写到Double Write缓冲区，然后再写到数据文件，这会带来一定的性能损耗。
额外的磁盘空间： 需要额外的磁盘空间来存储Double Write缓冲区。

Double Write的配置

Double Write可以通过innodb_doublewrite参数来控制是否启用。默认情况下，Double Write是启用的。

SHOW VARIABLES LIKE 'innodb_doublewrite';

如果你非常在意性能，并且对数据完整性要求不高，可以考虑禁用Double Write。但是，强烈建议不要轻易禁用Double Write，除非你非常清楚自己在做什么。

实际案例分析

假设你的MySQL服务器正在运行一个电商网站，每天都有大量的订单数据写入数据库。突然，服务器断电了！

如果没有Double Write，很可能有一部分订单数据会因为“部分写失效”而损坏，导致订单丢失，损失惨重。

但是，有了Double Write，即使发生断电，InnoDB也能从Double Write缓冲区中恢复损坏的数据页，保证订单数据的完整性，避免了不必要的损失。

Double Write和其他技术的配合

Double Write并不是孤立存在的，它通常和其他技术配合使用，共同保证数据的完整性。

Redo Log： Redo Log记录了所有对数据的修改操作，用于在崩溃恢复时重做未完成的事务。 Double Write保证了数据页的物理完整性，而Redo Log保证了事务的逻辑完整性。
Checksum： Checksum用于校验数据页的完整性。 InnoDB会在读取数据页时计算Checksum，并与数据页中存储的Checksum进行比较。如果不匹配，说明数据页可能损坏。

结论：Double Write，数据的守护神

总而言之，Double Write是InnoDB中一项非常重要的技术，它通过将数据页先写入到Double Write缓冲区，然后再写入到数据文件，从而保证了即使发生“部分写失效”，也能恢复数据，保证数据的完整性。

虽然Double Write会带来一定的性能损耗，但是相对于数据的安全性来说，这点损耗是完全可以接受的。

所以，记住，Double Write就像你的数据的守护神，默默地保护着你的数据，让你在面对崩溃、宕机等突发情况时，也能安心无忧。

互动环节：你问我答

好了，今天的讲座就到这里。接下来是互动环节，大家有什么问题可以提出来，我会尽力解答。别客气，大胆提问吧！毕竟，学习就是要不断提问，不断思考，才能真正掌握知识。

（等待观众提问…）

感谢大家！

感谢各位观众老爷的捧场！希望今天的讲座对大家有所帮助。我们下次再见！

发表回复 取消回复

发表回复取消回复