理解 `InnoDB` 的 `MVCC` 实现：`trx_id`、`roll_pointer` 和 `undo log` 的协同工作机制。 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

InnoDB MVCC 实现原理：trx_id, roll_pointer, undo log 协同工作机制详解

大家好，今天我们来深入探讨 InnoDB 的多版本并发控制 (MVCC) 实现机制，重点剖析 trx_id (事务ID), roll_pointer (回滚指针) 和 undo log (撤销日志) 这三个关键组件是如何协同工作，保证事务隔离性和数据一致性的。

1. 事务 ID (`trx_id`)：事务的唯一身份标识

trx_id 是 InnoDB 中每个事务的唯一标识符。它是一个递增的整数，由 InnoDB 存储引擎维护。每当一个新的事务启动时，InnoDB 都会分配一个新的 trx_id。

作用：

事务追踪: 识别和区分不同的事务。
版本控制: 用于判断数据行版本对当前事务的可见性。
隔离级别: 在不同的隔离级别下，trx_id 被用来确定哪些版本的数据可以被读取。

实现：

trx_id 的分配由 InnoDB 内部的事务系统管理。当事务开始时，会从一个全局的 trx_id 分配器获取一个新的 ID。

代码示例 (伪代码，仅用于说明概念):

// 事务开始时
trx_id_t start_transaction() {
  trx_id_t new_id = global_trx_id_allocator.allocate();
  // ... 其他事务初始化操作 ...
  return new_id;
}

2. 回滚指针 (`roll_pointer`)：数据版本链的纽带

roll_pointer 是一个指向 undo log 的指针。它存储在每一行数据的隐藏字段中。当一行数据被修改时，InnoDB 会将修改前的旧版本数据写入到 undo log 中，并将 roll_pointer 指向这个 undo log 记录。

作用：

版本链维护: 将同一行数据的不同版本串联起来，形成一个版本链。
版本回溯: 通过 roll_pointer 可以找到数据的旧版本，用于实现 MVCC 的读取操作。

实现：

每一行数据（在InnoDB的聚簇索引中）都包含一个隐藏的 roll_pointer 字段。当数据被更新时，旧数据被写入 undo log，而 roll_pointer 则更新为指向新创建的 undo log 记录。

代码示例 (伪代码，仅用于说明概念):

// 更新一行数据时
void update_row(row_t* row, data_t new_data) {
  // 1. 创建 undo log 记录，保存旧数据
  undo_log_t* undo_log = create_undo_log(row->data);

  // 2. 更新 roll_pointer 指向新的 undo log
  row->roll_pointer = undo_log;

  // 3. 更新数据
  row->data = new_data;
}

数据行结构 (简化版):

字段	类型	说明
数据列1	…	用户定义的数据列
数据列2	…	用户定义的数据列
…	…	…
`trx_id`	`trx_id_t`	创建或修改该行的事务 ID
`roll_pointer`	`pointer`	指向 undo log 的指针，用于回溯到之前的版本

3. 撤销日志 (`undo log`)：数据恢复的基石

undo log 记录了数据修改前的原始状态。它用于在事务回滚时撤销修改，并为 MVCC 提供旧版本数据。undo log 分为两种类型：

Insert Undo Log: 用于回滚 INSERT 操作。
Update Undo Log: 用于回滚 UPDATE 和 DELETE 操作。

作用：

事务回滚: 在事务失败或显式回滚时，用于恢复数据到修改前的状态。
MVCC 读取: 提供数据的旧版本，允许并发读取和写入。

实现：

undo log 存储在特殊的 undo log 段中。每个 undo log 记录包含足够的信息来恢复数据到之前的状态。对于 UPDATE 操作，undo log 会记录被修改的列的原始值。对于 DELETE 操作，undo log 会记录被删除行的所有信息。

代码示例 (伪代码，仅用于说明概念):

// 创建 undo log 记录 (以 UPDATE 为例)
undo_log_t* create_undo_log(data_t old_data) {
  undo_log_t* undo_log = allocate_undo_log();
  undo_log->type = UNDO_UPDATE;
  undo_log->old_data = old_data;
  return undo_log;
}

// 应用 undo log 记录 (回滚)
void apply_undo_log(undo_log_t* undo_log, row_t* row) {
  if (undo_log->type == UNDO_UPDATE) {
    row->data = undo_log->old_data;
  } else if (undo_log->type == UNDO_INSERT) {
    // ... 删除该行 ...
  } // ... 其他类型的 undo log ...
}

4. MVCC 工作流程：读取数据

当一个事务需要读取一行数据时，InnoDB 会根据以下规则判断数据的可见性：

版本可见性:
- 如果数据的 trx_id 小于或等于当前事务的 trx_id，说明该版本的数据在当前事务启动之前就已经存在，可以读取。
- 如果数据的 trx_id 大于当前事务的 trx_id，说明该版本的数据是在当前事务启动之后才被创建或修改的，不可读取。
删除标记:
- 如果数据的删除标记被设置，则表示该行已经被删除，不可读取。

如果当前版本的数据不可见，InnoDB 会沿着 roll_pointer 指向的 undo log 链，找到上一个版本的数据，并重复上述可见性判断，直到找到一个可见的版本或者到达版本链的末尾。

代码示例 (伪代码，仅用于说明概念):

// 读取一行数据时
data_t read_row(row_t* row, trx_id_t current_trx_id) {
  row_t* current_version = row;

  while (current_version != NULL) {
    // 1. 检查版本可见性
    if (current_version->trx_id <= current_trx_id) {
      // 2. 检查删除标记 (假设存在 delete_flag 字段)
      if (!current_version->delete_flag) {
        return current_version->data; // 找到可见版本
      }
    }

    // 3. 查找上一个版本
    if (current_version->roll_pointer != NULL) {
      undo_log_t* undo_log = current_version->roll_pointer;
      // 根据 undo log 恢复到上一个版本
      current_version = restore_row_from_undo_log(undo_log);
    } else {
      current_version = NULL; // 版本链结束
    }
  }

  return NULL; // 没有找到可见版本
}

5. MVCC 工作流程：更新数据

当一个事务需要更新一行数据时，InnoDB 会执行以下操作：

创建 undo log: 将旧版本的数据写入 undo log。
更新 roll_pointer: 将当前行的 roll_pointer 指向新创建的 undo log 记录。
更新数据: 将新的数据写入到当前行。
更新 trx_id: 将当前行的 trx_id 更新为当前事务的 trx_id。

代码示例 (伪代码，仅用于说明概念):

// 更新一行数据时
void update_row(row_t* row, data_t new_data, trx_id_t current_trx_id) {
  // 1. 创建 undo log 记录，保存旧数据
  undo_log_t* undo_log = create_undo_log(row->data);

  // 2. 更新 roll_pointer 指向新的 undo log
  row->roll_pointer = undo_log;

  // 3. 更新数据
  row->data = new_data;

  // 4. 更新 trx_id
  row->trx_id = current_trx_id;
}

6. MVCC 工作流程：删除数据

当一个事务需要删除一行数据时，InnoDB 不会立即物理删除该行，而是：

创建 undo log: 将旧版本的数据写入 undo log。
更新 roll_pointer: 将当前行的 roll_pointer 指向新创建的 undo log 记录。
设置删除标记: 设置该行的删除标记，表示该行已被删除。
更新 trx_id: 将当前行的 trx_id 更新为当前事务的 trx_id。

代码示例 (伪代码，仅用于说明概念):

// 删除一行数据时
void delete_row(row_t* row, trx_id_t current_trx_id) {
  // 1. 创建 undo log 记录，保存旧数据
  undo_log_t* undo_log = create_undo_log(row->data);

  // 2. 更新 roll_pointer 指向新的 undo log
  row->roll_pointer = undo_log;

  // 3. 设置删除标记
  row->delete_flag = true;

  // 4. 更新 trx_id
  row->trx_id = current_trx_id;
}

7. MVCC 与隔离级别

不同的隔离级别对 MVCC 的实现有不同的影响。

读未提交 (Read Uncommitted): 不使用 MVCC。可以读取到其他事务未提交的修改。
读已提交 (Read Committed): 每次读取都获取最新的已提交版本。同一个事务中，多次读取同一行数据，可能会得到不同的结果 (不可重复读)。
可重复读 (Repeatable Read): 在事务开始时创建一个快照，事务期间都读取该快照版本。同一个事务中，多次读取同一行数据，结果始终一致 (可重复读)。这是 InnoDB 默认的隔离级别。
串行化 (Serializable): 强制事务串行执行，避免并发问题。

在 Repeatable Read 隔离级别下，InnoDB 使用 MVCC 来保证可重复读。事务只会读取在事务开始时存在的版本，即使其他事务已经提交了新的修改。

8. Garbage Collection (GC) of Undo Logs

undo log 会占用存储空间。随着时间的推移，旧的 undo log 记录可能不再需要。InnoDB 会定期执行垃圾回收 (GC)，清理不再需要的 undo log。

判断 undo log 是否可以被清理的依据是：

没有事务需要访问该 undo log 记录所对应的版本。 这意味着所有活跃的事务的 trx_id 都大于该 undo log 记录的 trx_id，并且没有历史事务需要访问该版本。

代码示例 (伪代码，仅用于说明概念):

// 垃圾回收 undo log
void garbage_collect_undo_logs() {
  // 1. 获取所有活跃事务的 trx_id 列表
  std::vector<trx_id_t> active_trx_ids = get_active_transaction_ids();

  // 2. 遍历 undo log 链
  for (undo_log_t* undo_log : all_undo_logs) {
    // 3. 检查是否有活跃事务需要访问该 undo log 记录所对应的版本
    bool needed = false;
    for (trx_id_t trx_id : active_trx_ids) {
      if (undo_log->trx_id <= trx_id) {
        needed = true;
        break;
      }
    }

    // 4. 如果没有事务需要访问，则可以清理
    if (!needed) {
      free_undo_log(undo_log);
    }
  }
}

9. MVCC 的优势和局限性

优势：

提高并发性能： 允许读写操作并发执行，减少锁的竞争。
提供一致性视图： 保证事务读取到的数据是一致的。
支持不同的隔离级别： 可以根据应用的需求选择合适的隔离级别。

局限性：

需要额外的存储空间： undo log 会占用存储空间。
增加系统开销： MVCC 需要维护版本链，并进行版本判断，会增加系统开销。
长事务可能导致问题： 长时间运行的事务可能会阻止 undo log 的垃圾回收，导致存储空间膨胀。

10. 总结：数据版本控制，并发事务协调

trx_id 作为事务的唯一标识，roll_pointer 连接数据版本形成版本链，undo log 存储旧版本数据。这三个组件协同工作，实现了 InnoDB 的 MVCC 机制，从而保证了事务的隔离性和数据一致性，并提高了并发性能。理解这些组件的原理，能够帮助我们更好地理解 InnoDB 的内部工作机制，优化数据库性能，并解决实际应用中遇到的并发问题。

InnoDB MVCC 实现原理：trx_id, roll_pointer, undo log 协同工作机制详解

1. 事务 ID (trx_id)：事务的唯一身份标识

2. 回滚指针 (roll_pointer)：数据版本链的纽带

3. 撤销日志 (undo log)：数据恢复的基石

4. MVCC 工作流程：读取数据

5. MVCC 工作流程：更新数据

6. MVCC 工作流程：删除数据

7. MVCC 与隔离级别

8. Garbage Collection (GC) of Undo Logs

9. MVCC 的优势和局限性

10. 总结：数据版本控制，并发事务协调

发表回复 取消回复

1. 事务 ID (`trx_id`)：事务的唯一身份标识

2. 回滚指针 (`roll_pointer`)：数据版本链的纽带

3. 撤销日志 (`undo log`)：数据恢复的基石

发表回复取消回复