innodb - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

2025年9月6日

`InnoDB`的`压缩`：`ROW_FORMAT=COMPRESSED`的`实现`与`性能`影响。

InnoDB压缩：ROW_FORMAT=COMPRESSED的实现与性能影响大家好，今天我们来深入探讨InnoDB存储引擎的压缩功能，特别是ROW_FORMAT=COMPRESSED的实现机制和性能影响。在处理大数据量时，压缩可以显著降低存储空间，但同时也会引入额外的CPU开销。理解压缩的原理和权衡利弊对于优化数据库性能至关重要。 1. 压缩的动机与优势在数据爆炸式增长的今天，数据库存储成本成为一个不可忽视的问题。压缩技术通过减少数据占用的物理空间，从而降低硬件成本、备份时间和恢复时间，并提高I/O效率。 InnoDB提供了多种压缩方式，其中ROW_FORMAT=COMPRESSED是最常用的一种。它通过对单个数据页进行压缩，从而实现对表中所有数据的压缩。压缩的主要优势包括：节省存储空间: 这是最直接的好处，尤其是在存储成本较高的场景下。降低I/O负载: 压缩后的数据量减少，意味着磁盘I/O操作也减少，从而提高查询速度。提高缓存利用率: 压缩后的数据可以容纳更多的数据页在InnoDB buffer pool中，提高缓存命中率。 2. ROW_FORMAT=COMPRESSE …

继续阅读“`InnoDB`的`压缩`：`ROW_FORMAT=COMPRESSED`的`实现`与`性能`影响。”

2025年9月6日

`InnoDB`的`崩溃`恢复`（`Crash Recovery`）：`redo log`在`实例`启动时的`重放`流程。

好的，我们开始。 InnoDB 崩溃恢复：Redo Log 重放流程详解各位学员，大家好！今天我们来深入探讨InnoDB存储引擎在发生崩溃后，如何利用Redo Log进行数据恢复的关键流程。Redo Log是InnoDB实现ACID特性中持久性（Durability）的重要保障。理解其重放机制对于数据库管理员、开发者以及DBA来说至关重要。 1. Redo Log 的基本概念 Redo Log，即重做日志，记录了InnoDB存储引擎中所有对页（Page）的修改操作。当数据库发生崩溃时，Redo Log可以被用来重新执行这些修改，从而将数据库恢复到崩溃前的状态。物理日志: Redo Log记录的是物理层面的修改，即具体哪个页的哪个位置发生了什么变化。循环写入: Redo Log文件通常是循环写入的，由多个物理文件组成（如ib_logfile0, ib_logfile1等）。 LSN (Log Sequence Number): 每个Redo Log条目都有一个唯一的LSN，用于标识Redo Log的顺序。LSN是一个递增的数值，可以用来判断Redo Log的先后顺序。 Check …

继续阅读“`InnoDB`的`崩溃`恢复`（`Crash Recovery`）：`redo log`在`实例`启动时的`重放`流程。”

2025年9月6日

`InnoDB`的`IO Thread`：`后台`线程在`刷盘`和`预读`中的`作用`与`数量`配置。

InnoDB IO Thread：后台线程在刷盘和预读中的作用与数量配置大家好，今天我们来深入探讨InnoDB存储引擎中至关重要的组成部分——IO Thread，特别是它们在数据刷盘和预读机制中的作用，以及如何合理配置它们的数量。理解这些概念对于优化MySQL性能至关重要。 IO Thread 的基本概念 InnoDB使用多个后台线程来处理各种IO操作，这些线程被统称为IO Thread。它们的主要职责包括：数据刷盘 (Flushing): 将内存中的脏页（Dirty Pages）刷新到磁盘，确保数据的持久性。预读 (Read Ahead): 预测未来可能需要的数据页，提前从磁盘加载到缓冲池（Buffer Pool），提高查询效率。其他IO操作: 包括redo log的写入，以及其他一些维护操作。 IO Thread 并非只有一个，而是根据不同的职责被分为多个类型。常见的IO Thread类型包括： write IO thread: 专门负责将脏页刷新到磁盘。 read IO thread: 专门负责从磁盘读取数据页到缓冲池。 log IO thread: 负责将redo lo …

继续阅读“`InnoDB`的`IO Thread`：`后台`线程在`刷盘`和`预读`中的`作用`与`数量`配置。”

2025年9月6日

`InnoDB`的`预读`（`Read-Ahead`）机制：`异步`I/O在`大表`扫描中的`应用`。

InnoDB 预读：异步 I/O 在大表扫描中的应用大家好，今天我们来深入探讨 InnoDB 存储引擎中的预读机制，以及异步 I/O 在大表扫描中的具体应用。InnoDB 作为 MySQL 默认的存储引擎，其性能至关重要。预读作为一种优化策略，可以显著提升查询效率，特别是在处理大型数据表时。 1. 预读机制概述 InnoDB 预读是指在实际需要某个数据页之前，就提前将其从磁盘加载到 Buffer Pool 中。这样做的好处是，当真正需要该数据页时，可以直接从内存中读取，避免了耗时的磁盘 I/O 操作。InnoDB 实现了两种主要的预读方式：线性预读（Linear Read-Ahead）：当 InnoDB 检测到 Buffer Pool 中一系列连续的数据页被顺序访问时，它会认为可能需要访问后续的数据页，从而触发线性预读。InnoDB 会预先读取接下来几个连续的数据页。随机预读（Random Read-Ahead）：当 Buffer Pool 中某个区（Extent，1MB 大小，由 64 个连续的数据页组成，每个数据页 16KB）的数据页被访问次数达到一定阈值时，InnoDB …

继续阅读“`InnoDB`的`预读`（`Read-Ahead`）机制：`异步`I/O在`大表`扫描中的`应用`。”

2025年9月6日

`InnoDB`的`聚集索引`（`Clustered Index`）：`主键`索引的`物理`存储与`二级`索引的`引用`关系。

InnoDB 聚集索引：主键的物理存储与二级索引的引用大家好，今天我们来深入探讨 InnoDB 存储引擎中的核心概念之一：聚集索引。聚集索引对于理解 InnoDB 的数据存储方式，优化查询性能至关重要。我们会详细讲解聚集索引的物理存储结构，以及二级索引如何通过引用聚集索引实现数据的查找。什么是聚集索引？在 InnoDB 中，聚集索引决定了数据在磁盘上的物理存储顺序。更准确地说，表的数据行实际上是按照聚集索引的顺序存储的。每个 InnoDB 表都有一个聚集索引，通常情况下，这个聚集索引就是表的主键。如果表定义了主键，InnoDB 会使用主键作为聚集索引。如果没有定义主键，InnoDB 会选择一个非空唯一索引作为聚集索引。如果既没有主键，也没有非空唯一索引，InnoDB 会隐式地创建一个隐藏的聚集索引。聚集索引的物理存储 InnoDB 使用 B+ 树来实现索引。聚集索引的 B+ 树的叶子节点存储的是完整的数据行，而不是指向磁盘位置的指针。这就是聚集索引的核心特性：数据行和索引存储在一起。让我们看一个简单的例子。假设我们有一个 users 表，定义如下： CREATE TABLE …

继续阅读“`InnoDB`的`聚集索引`（`Clustered Index`）：`主键`索引的`物理`存储与`二级`索引的`引用`关系。”

2025年9月6日

`InnoDB`的`Online DDL`：`ALGORITHM=INPLACE`和`INSTANT`的`底层`实现与`数据`拷贝`机制`。

好的，下面开始本次关于InnoDB Online DDL中ALGORITHM=INPLACE和INSTANT的底层实现与数据拷贝机制的讲座。 InnoDB Online DDL: ALGORITHM=INPLACE vs. INSTANT – 底层机制深度剖析大家好，今天我们来深入探讨InnoDB中Online DDL（在线数据定义语言）的两种关键算法：ALGORITHM=INPLACE和ALGORITHM=INSTANT。了解它们的底层实现和数据拷贝机制，对于我们更好地使用和优化数据库至关重要。 1. Online DDL 概述首先，简单回顾一下Online DDL的概念。在传统DDL操作中，数据库通常需要锁定整个表，阻止读写操作，这会导致服务中断。 Online DDL的目标是在执行DDL操作的同时，尽可能减少甚至消除锁定，允许并发的读写操作，从而减少对应用程序的影响。 InnoDB通过多种算法实现了Online DDL，其中最重要的是ALGORITHM=INPLACE和ALGORITHM=INSTANT。如果没有指定ALGORITHM，InnoDB会根据操作 …

继续阅读“`InnoDB`的`Online DDL`：`ALGORITHM=INPLACE`和`INSTANT`的`底层`实现与`数据`拷贝`机制`。”

2025年9月6日

`InnoDB`的`MVCC`（`多版本并发控制`）：`Read View`的`创建`与`可见性`判断`算法`。

InnoDB MVCC：Read View 的创建与可见性判断算法大家好，今天我们来深入探讨 InnoDB 存储引擎中的 MVCC（多版本并发控制）机制，特别是 Read View 的创建以及基于 Read View 的可见性判断算法。 MVCC 是 InnoDB 实现并发控制的关键技术，它允许多个事务并发读写数据，而无需加锁，从而显著提升数据库的并发性能。 1. MVCC 简介在深入 Read View 之前，我们先简单回顾一下 MVCC 的基本概念。 MVCC 的核心思想是：为每一行数据保存多个版本：当一个事务修改某行数据时，InnoDB 并不会直接覆盖旧版本的数据，而是创建一个新的版本。通过 Read View 来判断事务可以访问哪些版本的数据：每个事务在执行期间都会创建一个 Read View，它定义了当前事务可以看到哪些数据版本。这样，不同的事务在不同的时间点创建 Read View，就可以看到不同版本的数据，从而实现并发读写而不相互阻塞。 2. Read View 的结构 Read View 是 MVCC 实现的关键数据结构，它包含了当前活跃事务的信息，用于判 …

继续阅读“`InnoDB`的`MVCC`（`多版本并发控制`）：`Read View`的`创建`与`可见性`判断`算法`。”

2025年9月6日

`InnoDB`的`锁`管理器`（`Lock Manager`）：`行锁`、`表锁`和`意向锁`的`实现`与`死锁`检测`算法`。

好的，我们现在开始。 InnoDB 锁管理器：行锁、表锁和意向锁的实现与死锁检测算法大家好，今天我们来深入探讨 InnoDB 存储引擎的锁管理器，重点关注行锁、表锁和意向锁的实现，以及死锁检测算法。锁是并发控制的关键机制，理解 InnoDB 的锁机制对于构建高性能、高并发的数据库应用至关重要。 1. 锁的概念与作用锁是一种同步机制，用于控制多个事务并发访问共享资源，防止数据不一致。在数据库系统中，锁保证了事务的隔离性，是 ACID 属性（原子性、一致性、隔离性、持久性）中的隔离性的重要组成部分。 2. InnoDB 锁的分类 InnoDB 支持多种类型的锁，主要包括：行锁（Row Lock）：针对表中的特定行进行锁定。表锁（Table Lock）：针对整个表进行锁定。意向锁（Intention Lock）：表级的锁，表示事务打算在表中加行锁。记录锁（Record Lock）：锁住索引记录。间隙锁（Gap Lock）：锁住索引记录的间隙，防止幻读。临键锁（Next-Key Lock）：记录锁 + 间隙锁，锁定一个范围。插入意向锁（Insert Inten …

继续阅读“`InnoDB`的`锁`管理器`（`Lock Manager`）：`行锁`、`表锁`和`意向锁`的`实现`与`死锁`检测`算法`。”

2025年9月6日

`InnoDB`的`Checkpoint`机制：`日志`、`缓存`和`磁盘`的`协同`工作流程。

好的，下面我将以讲座的形式，详细讲解InnoDB的Checkpoint机制，以及日志、缓存和磁盘的协同工作流程。 InnoDB Checkpoint机制：保障数据一致性的关键大家好！今天我们来深入探讨InnoDB存储引擎中一个至关重要的机制——Checkpoint。Checkpoint机制在保证数据一致性和提高数据库性能方面起着举足轻重的作用。理解Checkpoint的工作原理，对于我们更好地理解和优化MySQL数据库至关重要。什么是Checkpoint？简单来说，Checkpoint就是将缓冲池（Buffer Pool）中的脏页（Dirty Pages）刷新到磁盘的过程。脏页是指在缓冲池中被修改过，但尚未同步到磁盘的数据页。Checkpoint的目的在于缩短数据库恢复时间，以及减少重做日志（Redo Log）的大小，从而提高数据库的整体性能。为什么需要Checkpoint？考虑这样一种情况：数据库突然崩溃。如果没有Checkpoint机制，数据库在重启后，需要扫描整个重做日志，将所有未同步到磁盘的数据页进行重做，才能恢复到崩溃前的状态。这将会耗费大量的时间，严重影响数据库的 …

继续阅读“`InnoDB`的`Checkpoint`机制：`日志`、`缓存`和`磁盘`的`协同`工作流程。”

2025年9月6日

`InnoDB`的`File Space`管理：`段`、`区`、`页`的`物理`组织与`空间`分配算法。

InnoDB File Space 管理：段、区、页的物理组织与空间分配算法大家好，今天我们来深入探讨 InnoDB 存储引擎中关于 File Space 管理的核心概念：段 (Segment)、区 (Extent) 和页 (Page)，以及它们之间的物理组织关系和空间分配算法。理解这些概念对于优化 MySQL 数据库性能至关重要。 1. File Space 概述 InnoDB 将所有的数据，包括表数据、索引数据、系统数据（如数据字典）等，都存储在一个或多个数据文件中。这些数据文件共同构成了一个 File Space。File Space 提供了一种逻辑上的视图，使得 InnoDB 可以统一管理磁盘上的存储空间。 InnoDB 默认使用共享表空间 (System Tablespace)，即所有表的数据和索引都存储在一个名为 ibdata1 的文件中（或多个 ibdataN 文件）。当然，也可以配置为每个表使用独立表空间 (File-Per-Table Tablespace)，在这种模式下，每个表的数据和索引都会存储在一个独立的 .ibd 文件中。无论使用哪种表空间模式，InnoD …

继续阅读“`InnoDB`的`File Space`管理：`段`、`区`、`页`的`物理`组织与`空间`分配算法。”