MySQL优化器与执行计划之：`MySQL`的`连接优化`：`BNL`（`Block Nested-Loop`）和`BKA`（`Batched Key Access`）的底层算法。

MySQL连接优化：BNL与BKA算法深入解析

大家好，今天我们来深入探讨MySQL连接优化中两种重要的算法：Block Nested-Loop (BNL) 和 Batched Key Access (BKA)。理解这两种算法的工作原理，有助于我们更好地编写高效的SQL查询，避免性能陷阱。

1. 连接操作的基础与挑战

在关系型数据库中，连接操作是构建复杂查询的核心。它允许我们基于一个或多个共同列，将来自多个表的数据组合在一起。最简单的连接操作是Nested-Loop Join，但当表的数据量很大时，它的效率会急剧下降。

Nested-Loop Join (NLJ) 的基本原理：

NLJ算法遍历外表（驱动表）的每一行，然后内表（被驱动表）扫描每一行，比较连接条件。如果匹配，则合并两行并输出结果。

-- 示例：两个表 employees 和 departments，连接条件是 employees.department_id = departments.id
SELECT *
FROM employees e
JOIN departments d ON e.department_id = d.id;

NLJ的伪代码：

for each row_outer in outer_table:
  for each row_inner in inner_table:
    if row_outer.join_column == row_inner.join_column:
      output row_outer + row_inner
    end if
  end for
end for

NLJ的性能问题：

假设外表有M行，内表有N行，那么NLJ算法需要进行M * N次比较。当M和N都很大的时候，这个计算量是巨大的。尤其当内表没有索引，需要全表扫描时，性能问题更为突出。

2. Block Nested-Loop Join (BNL)

BNL是NLJ的改进版本，旨在减少内表的扫描次数。它通过将外表的数据分批加载到内存中，形成一个“块”，然后使用这个块去扫描内表，从而减少内表的扫描次数。

BNL算法的核心思想：

将外表的数据分批加载到Join Buffer中，然后使用Join Buffer中的数据去扫描内表。

BNL算法的执行步骤：

分配Join Buffer: MySQL会分配一块内存区域，用于存放外表的部分数据。Join Buffer的大小由join_buffer_size参数控制（默认较小，需要根据实际情况调整）。
填充Join Buffer: 从外表读取数据，填充Join Buffer，直到Join Buffer被填满。
扫描内表: 使用Join Buffer中的数据去扫描内表。对于内表的每一行，都与Join Buffer中的所有行进行比较，如果满足连接条件，则输出结果。
重复步骤2和3: 如果外表还有剩余数据，重复步骤2和3，直到外表的所有数据都被处理完毕。

BNL的伪代码：

outer_table_rows = get_all_rows(outer_table)
inner_table_rows = get_all_rows(inner_table)
join_buffer = []

for each chunk in chunkify(outer_table_rows, join_buffer_size):
    join_buffer = chunk  # Load a chunk of outer table rows into the join buffer

    for each row_inner in inner_table_rows:
        for each row_outer in join_buffer:
            if row_outer.join_column == row_inner.join_column:
                output row_outer + row_inner
            end if
        end for
    end for
end for

function chunkify(rows, chunk_size):
  chunks = []
  current_chunk = []
  size = 0
  for row in rows:
    row_size = estimate_row_size(row) # 假设有一个函数估计行的大小
    if size + row_size <= chunk_size:
      current_chunk.append(row)
      size += row_size
    else:
      chunks.append(current_chunk)
      current_chunk = [row]
      size = row_size
  if current_chunk:
    chunks.append(current_chunk)
  return chunks

BNL的优化效果：

BNL减少了内表的扫描次数。假设外表有M行，内表有N行，Join Buffer可以容纳B行外表数据，那么内表的扫描次数就从M次减少到M/B次。

BNL的适用场景：

小表驱动大表: 适合外表较小，内表较大的情况。
连接列没有索引: 当连接列没有索引时，BNL通常是比NLJ更好的选择。

BNL的使用限制和注意事项：

join_buffer_size参数: 控制Join Buffer的大小。如果Join Buffer太小，则BNL的优化效果不明显。但是，如果Join Buffer太大，则可能占用过多的内存资源。需要根据实际情况调整。
只能用于等值连接: BNL只能用于等值连接（=），不能用于范围连接（<、>）。
Extra列的Using join buffer (Block Nested Loop): 在EXPLAIN输出中，如果Extra列显示Using join buffer (Block Nested Loop)，则表示MySQL使用了BNL算法。

BNL示例：

假设我们有两个表：orders (1000行) 和 customers (100000行)，orders.customer_id 和 customers.id 是连接条件，且 customers.id 没有索引。

EXPLAIN SELECT * FROM orders o JOIN customers c ON o.customer_id = c.id;

如果EXPLAIN输出的Extra列显示Using join buffer (Block Nested Loop)，则表示MySQL使用了BNL算法。

强制使用BNL (不推荐，仅用于演示目的):

虽然不推荐直接强制指定优化器使用某种算法，但为了演示BNL的效果，可以使用optimizer_switch来控制：

SET optimizer_switch = 'block_nested_loop=on'; -- 开启BNL
EXPLAIN SELECT * FROM orders o JOIN customers c ON o.customer_id = c.id;
SET optimizer_switch = 'block_nested_loop=off'; -- 关闭BNL (恢复默认设置)

重要提示： 强制关闭或开启优化器开关通常不是最佳实践。更好的方法是通过添加索引、重写查询等方式来引导优化器选择更合适的执行计划。

3. Batched Key Access (BKA)

BKA是另一种连接优化算法，它利用索引来加速连接操作。它适用于内表连接列上有索引的情况。

BKA算法的核心思想：

将外表的数据分批加载到Join Buffer中，然后根据Join Buffer中的连接列的值，批量地从内表的索引中查找匹配的行。

BKA算法的执行步骤：

分配Join Buffer: 与BNL类似，MySQL会分配一块内存区域，用于存放外表的部分数据。
填充Join Buffer: 从外表读取数据，填充Join Buffer，直到Join Buffer被填满。
构建查找键列表: 从Join Buffer中提取连接列的值，构建一个查找键列表。
批量查找: 使用查找键列表，批量地从内表的索引中查找匹配的行。
连接结果: 将从内表查找到的行与Join Buffer中的行进行连接，输出结果。
重复步骤2-5: 如果外表还有剩余数据，重复步骤2-5，直到外表的所有数据都被处理完毕。

BKA的伪代码：

outer_table_rows = get_all_rows(outer_table)
inner_table_index = get_index(inner_table, join_column)
join_buffer = []

for each chunk in chunkify(outer_table_rows, join_buffer_size):
    join_buffer = chunk  # Load a chunk of outer table rows into the join buffer

    lookup_keys = [row_outer.join_column for row_outer in join_buffer] # Extract join column values

    inner_table_rows = batch_index_lookup(inner_table_index, lookup_keys)  # Batch index lookup

    for row_outer in join_buffer:
        for row_inner in inner_table_rows:
            if row_outer.join_column == row_inner.join_column:
                output row_outer + row_inner
            end if
        end for
    end for
end for

function batch_index_lookup(index, keys):
    rows = []
    for key in keys:
        rows.extend(index.lookup(key))  # 假设index.lookup(key)返回匹配的行
    return rows

BKA的优化效果：

BKA利用索引，避免了内表的全表扫描。通过批量查找，减少了索引查找的开销。

BKA的适用场景：

内表连接列有索引: 这是BKA的前提条件。
小表驱动大表: 与BNL类似，适合外表较小，内表较大的情况。

BKA的使用限制和注意事项：

需要索引: 内表连接列必须有索引。
join_buffer_size参数: 影响Join Buffer的大小，进而影响每次批量查找的键的数量。
mrr_capacity和mrr_cost_based参数: BKA依赖于MRR（Multi-Range Read）优化。mrr_capacity控制MRR使用的buffer大小，mrr_cost_based控制是否使用基于成本的MRR优化。
Extra列的Using join buffer (Batched Key Access): 在EXPLAIN输出中，如果Extra列显示Using join buffer (Batched Key Access)，则表示MySQL使用了BKA算法。

BKA示例：

假设我们有两个表：orders (1000行) 和 customers (100000行)，orders.customer_id 和 customers.id 是连接条件，且 customers.id 上有索引。

CREATE INDEX idx_customer_id ON customers (id); -- 创建索引
EXPLAIN SELECT * FROM orders o JOIN customers c ON o.customer_id = c.id;

如果EXPLAIN输出的Extra列显示Using join buffer (Batched Key Access)，则表示MySQL使用了BKA算法。

启用BKA (如果默认未启用):

BKA的启用依赖于optimizer_switch和MRR的相关参数。确保以下设置：

SET optimizer_switch = 'mrr=on,mrr_cost_based=on,batched_key_access=on';

重要提示： 在生产环境中修改optimizer_switch需要谨慎评估，因为这可能会影响其他查询的执行计划。

4. BNL vs. BKA：如何选择？

BNL和BKA都是连接优化算法，但它们适用于不同的场景。

特性	BNL	BKA
连接列索引	无需索引	需要内表连接列上的索引
适用场景	内表连接列无索引，小表驱动大表	内表连接列有索引，小表驱动大表
依赖优化	无	MRR (Multi-Range Read)
主要优化策略	减少内表扫描次数	利用索引，批量查找
`EXPLAIN` 输出	`Using join buffer (Block Nested Loop)`	`Using join buffer (Batched Key Access)`

选择建议：

优先考虑索引: 如果内表连接列上可以创建索引，则优先创建索引，并启用BKA。
评估索引维护成本: 创建索引会带来额外的维护成本。如果索引的维护成本过高，或者查询频率较低，则可以考虑使用BNL。
监控和测试: 使用EXPLAIN分析查询的执行计划，并进行性能测试，选择最佳的方案。
STRAIGHT_JOIN的使用: 谨慎使用STRAIGHT_JOIN，因为它会强制MySQL按照指定的顺序连接表，可能会导致性能下降。应该让优化器根据成本选择最佳的连接顺序。

5. 实际案例分析

假设我们有三个表：users (10000行), orders (100000行), order_details (1000000行)。

-- users: id (PK), name, ...
-- orders: id (PK), user_id (FK), order_date, ...
-- order_details: id (PK), order_id (FK), product_id, quantity, ...

案例1：查询每个用户的订单总数

SELECT u.name, COUNT(o.id) AS total_orders
FROM users u
JOIN orders o ON u.id = o.user_id
GROUP BY u.name;

如果orders.user_id没有索引，MySQL可能会选择BNL。
如果orders.user_id有索引，MySQL可能会选择BKA。

优化方案：

在orders.user_id上创建索引：CREATE INDEX idx_user_id ON orders (user_id);
确保BKA已启用：SET optimizer_switch = 'mrr=on,mrr_cost_based=on,batched_key_access=on';

案例2：查询每个订单的详细信息

SELECT o.id, SUM(od.quantity) AS total_quantity
FROM orders o
JOIN order_details od ON o.id = od.order_id
GROUP BY o.id;

如果order_details.order_id没有索引，MySQL可能会选择BNL。
如果order_details.order_id有索引，MySQL可能会选择BKA。

优化方案：

在order_details.order_id上创建索引：CREATE INDEX idx_order_id ON order_details (order_id);
确保BKA已启用：SET optimizer_switch = 'mrr=on,mrr_cost_based=on,batched_key_access=on';

案例3：复杂的多表连接

SELECT u.name, SUM(od.quantity) AS total_quantity
FROM users u
JOIN orders o ON u.id = o.user_id
JOIN order_details od ON o.id = od.order_id
WHERE u.name LIKE 'A%'
GROUP BY u.name;

这个查询涉及三个表的连接。MySQL优化器会根据成本选择最佳的连接顺序和算法。

优化方案：

在orders.user_id和order_details.order_id上创建索引。
优化WHERE子句，尽量减少需要连接的数据量。
分析EXPLAIN输出，确保MySQL选择了合适的执行计划。

6. 理解优化器成本模型的重要性

MySQL优化器会根据成本模型来选择最佳的执行计划。成本模型考虑了CPU、IO、内存等资源的使用情况。

影响成本模型的因素：

表的大小: 更大的表通常意味着更高的成本。
索引的效率: 更高效的索引可以降低IO成本。
硬件资源: CPU、内存、磁盘IO等硬件资源会影响成本。
MySQL配置参数: 例如join_buffer_size、mrr_capacity等参数会影响成本。

优化建议：

定期更新统计信息: 使用ANALYZE TABLE更新表的统计信息，帮助优化器做出更准确的决策。
调整配置参数: 根据硬件资源和应用特点，调整MySQL的配置参数。
监控查询性能: 监控查询的执行时间、IO使用情况等指标，及时发现性能问题。
理解EXPLAIN输出: EXPLAIN输出提供了关于执行计划的详细信息，包括使用的算法、索引、连接顺序等。

7. 调整`join_buffer_size`的考量

join_buffer_size参数控制着BNL和BKA算法使用的Join Buffer的大小。

join_buffer_size设置过小的影响:

BNL的优化效果不明显，内表仍然需要多次扫描。
BKA每次批量查找的键的数量较少，索引查找的效率较低。

join_buffer_size设置过大的影响:

占用过多的内存资源，可能导致服务器性能下降。
可能导致其他查询缺乏足够的内存资源。

join_buffer_size的调整策略：

初始值: 可以从默认值开始，例如256KB或512KB。
逐步增加: 逐步增加join_buffer_size，每次增加一定比例（例如50%或100%）。
监控性能: 每次调整后，监控查询的执行时间、IO使用情况等指标，观察性能变化。
达到瓶颈: 当join_buffer_size增加到一定程度后，性能提升不再明显，甚至开始下降，则说明已经达到了瓶颈。
资源限制: 考虑服务器的硬件资源限制，避免过度占用内存。

示例：

-- 查看当前的 join_buffer_size
SHOW VARIABLES LIKE 'join_buffer_size';

-- 设置 join_buffer_size (需要SUPER权限)
SET GLOBAL join_buffer_size = 1048576; -- 1MB

-- 再次查看确认
SHOW VARIABLES LIKE 'join_buffer_size';

重要提示： join_buffer_size是一个全局参数，修改它会影响所有连接。因此，在生产环境中修改join_buffer_size需要谨慎评估，并进行充分的测试。

8. 性能优化是一项持续性的工作

连接优化是一个复杂的主题，需要深入理解MySQL的优化器、执行计划、成本模型等。BNL和BKA是两种重要的连接优化算法，但它们并非万能的。

持续优化的关键：

监控： 持续监控查询性能，及时发现问题。
分析： 使用EXPLAIN分析执行计划，找出瓶颈。
测试： 进行性能测试，验证优化方案的效果。
学习： 持续学习MySQL的优化知识，提升优化能力。

核心原则：

索引是王道： 尽可能为连接列创建索引。
小表驱动大表： 尽量选择小表作为驱动表。
避免全表扫描： 尽量避免全表扫描，特别是对于大表。
合理使用优化器提示： 在必要的时候，可以使用优化器提示来影响执行计划，但要谨慎使用。

希望今天的分享对大家有所帮助。

理解与应用

BNL和BKA是MySQL中重要的连接优化算法。理解它们的工作原理，并结合实际场景进行选择和调整，可以有效地提升查询性能。记住，性能优化是一个持续的过程，需要不断学习和实践。

MySQL连接优化：BNL与BKA算法深入解析

1. 连接操作的基础与挑战

2. Block Nested-Loop Join (BNL)

3. Batched Key Access (BKA)

4. BNL vs. BKA：如何选择？

5. 实际案例分析

6. 理解优化器成本模型的重要性

7. 调整join_buffer_size的考量

8. 性能优化是一项持续性的工作

理解与应用

发表回复 取消回复

7. 调整`join_buffer_size`的考量

发表回复取消回复