MySQL高级讲座篇之：MySQL的`Optimizer Trace`：如何追踪查询优化器的决策路径？ - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

各位观众老爷，晚上好！我是今晚的主讲人，咱们今天要聊聊MySQL里一个相当好玩的工具——Optimizer Trace，也就是查询优化器追踪。这玩意儿能让你像X光一样，看穿MySQL优化器在处理你的SQL语句时到底在想些啥，做了哪些决策，以及最终选择了哪条执行路径。

一、啥是Optimizer Trace？

简单来说，Optimizer Trace是MySQL提供的一个功能，允许你查看查询优化器处理SQL语句的详细过程。优化器是MySQL的心脏，它负责决定如何最有效地执行你的查询。它会考虑各种因素，比如索引、表的大小、连接顺序等等，然后选择一个“最佳”的执行计划。

有时候，你写的SQL语句执行起来慢得像蜗牛，但你又不知道问题出在哪里。这时候，Optimizer Trace就能派上大用场了。它能告诉你：

优化器都考虑了哪些执行计划？
为什么优化器选择了当前的执行计划？
哪些因素影响了优化器的决策？
有没有可能优化器选错了执行计划？

二、如何使用Optimizer Trace？

使用Optimizer Trace非常简单，只需要几个步骤：

开启Trace:
```
SET optimizer_trace="enabled=on";
SET end_markers_in_json=on; -- 可选，让输出更易读
```
optimizer_trace="enabled=on" 表示开启Optimizer Trace。end_markers_in_json=on是一个可选设置，它会在JSON输出中添加结束标记，使输出更易于阅读。

执行你的SQL语句:

SELECT * FROM orders WHERE customer_id = 123 AND order_date > '2023-01-01';

执行你想要分析的SQL语句。

查看Trace结果:
```
SELECT * FROM `information_schema`.`OPTIMIZER_TRACE`G
```
这条SQL语句会从information_schema.OPTIMIZER_TRACE表中检索Trace结果。G 是MySQL客户端的一个小技巧，它会将结果以垂直方式显示，更易于阅读。
关闭Trace:
```
SET optimizer_trace="enabled=off";
```
分析完之后，记得关闭Optimizer Trace，因为它会带来一些性能开销。

三、 Trace结果解读：JSON格式的秘密

Optimizer Trace的结果是一个巨大的JSON文档，里面包含了优化器处理SQL语句的每一个步骤的详细信息。一开始看到可能会觉得眼花缭乱，但别担心，我们一步步来解读。

JSON文档大致可以分为几个部分：

steps: 这是最重要的部分，它包含了优化器执行的每一个步骤。每个步骤都包含了详细的描述和相关的数据。
transformation: 优化器对SQL语句进行的转换，例如子查询优化、常量折叠等等。
condition_processing: 条件处理，包括索引选择、范围扫描等等。
rows_estimation: 行数估算，优化器会估算每个操作会返回多少行数据，这对于选择最佳执行计划至关重要。
access_paths: 访问路径，优化器会考虑不同的访问路径，例如全表扫描、索引扫描等等。
considered_execution_plans: 考虑的执行计划，优化器会考虑多个执行计划，并选择一个“最佳”的执行计划。

举个栗子：分析一个简单的查询

假设我们有一个orders表，包含order_id, customer_id, order_date等字段。我们执行以下查询：

SELECT * FROM orders WHERE customer_id = 123 AND order_date > '2023-01-01';

我们按照上面的步骤开启Trace，执行SQL语句，然后查看Trace结果。Trace结果的steps部分可能会包含以下内容（为了方便阅读，这里只列出关键部分）：

[
  {
    "join_preparation": {
      "select#": 1,
      "steps": [
        {
          "transform_before_transformation": "SELECT * FROM orders WHERE customer_id = 123 AND order_date > '2023-01-01'"
        },
        {
          "transform_after_transformation": "SELECT * FROM orders WHERE customer_id = 123 AND order_date > '2023-01-01'"
        }
      ]
    }
  },
  {
    "condition_processing": {
      "select#": 1,
      "condition": "WHERE",
      "original_condition": "(`orders`.`customer_id` = 123) and (`orders`.`order_date` > '2023-01-01')",
      "steps": [
        {
          "transformation": "equality_propagation",
          "resulting_condition": "(`orders`.`customer_id` = 123) and (`orders`.`order_date` > '2023-01-01')"
        },
        {
          "transformation": "constant_propagation",
          "resulting_condition": "(`orders`.`customer_id` = 123) and (`orders`.`order_date` > '2023-01-01')"
        },
        {
          "substitute_generated_columns": {}
        },
        {
          "table_dependencies": [
            {
              "table": "`orders`",
              "row_may_be_null": false
            }
          ]
        },
        {
          "column_dependencies": [
            {
              "table": "`orders`",
              "column": "`customer_id`"
            },
            {
              "table": "`orders`",
              "column": "`order_date`"
            }
          ]
        },
        {
          "partitions_ pruning": {
            "partitions_pruining_possible": false,
            "partitions_pruining_performance": "ok",
            "partitions_pruining_limit": "unlimited"
          }
        },
        {
          "rows_estimation": [
            {
              "table": "`orders`",
              "range_analysis": {
                "table_scan": {
                  "rows": 20000,
                  "cost": 42.75
                },
                "potential_range_indexes": [
                  {
                    "index": "customer_id_idx",
                    "usable": true,
                    "key_parts": [
                      "customer_id",
                      "order_date"
                    ]
                  },
                  {
                    "index": "order_date_idx",
                    "usable": true,
                    "key_parts": [
                      "order_date"
                    ]
                  }
                ],
                "best_covering_index_scan": null,
                "best_access_path": {
                  "direction": "both",
                  "index": "customer_id_idx",
                  "rows": 50,
                  "cost": 51.31,
                  "chosen": true
                },
                "chosen_range_access_summary": {
                  "range_scan_plan": {
                    "index": "customer_id_idx",
                    "rows": 50,
                    "cost": 51.31,
                    "intervals": [
                      "123"
                    ]
                  },
                  "rowid_ordered": false,
                  "using_mrr": false,
                  "index_dives_for_eq_ranges": true,
                  "rowid_filtering_after_initial_index_scan": true,
                  "rows_for_range": 50,
                  "cost_for_range": 51.31,
                  "chosen": true
                }
              }
            }
          ]
        }
      ]
    }
  },
  {
    "considered_execution_plans": [
      {
        "plan_prefix": [],
        "table": "`orders`",
        "best_access_path": {
          "direction": "both",
          "index": "customer_id_idx",
          "rows": 50,
          "cost": 51.31,
          "chosen": true
        },
        "condition_filtering_pct": 100,
        "rows_for_plan": 50,
        "cost_for_plan": 51.31,
        "rest_of_plan": [ ]
      }
    ]
  },
  {
    "chosen_plan": {
      "table": "`orders`" ,
      "best_access_path": {
          "direction": "both",
          "index": "customer_id_idx",
          "rows": 50,
          "cost": 51.31,
          "chosen": true
        }
    }
  }
]

从上面的Trace结果中，我们可以看到：

优化器首先对SQL语句进行了准备工作 (join_preparation)。
然后，优化器处理了WHERE子句中的条件 (condition_processing)。
在condition_processing中，我们可以看到优化器考虑了不同的索引 (potential_range_indexes)，包括customer_id_idx和order_date_idx。
优化器最终选择了customer_id_idx索引 (best_access_path)。
considered_execution_plans 展示了优化器最终确定的执行计划，它选择了使用索引 customer_id_idx。
chosen_plan 最终确认了选择的计划。

四、索引选择的奥秘

索引选择是优化器最关键的决策之一。优化器会根据各种因素来选择最佳的索引，例如：

索引的类型: B-Tree索引、Hash索引、全文索引等等。
索引的选择性: 索引的选择性越高，意味着索引能够过滤掉更多的数据，索引的效果就越好。
查询的条件: 查询的条件是否能够使用索引。
表的大小: 表越大，使用索引的收益就越大。
IO成本: 使用索引需要读取索引页和数据页，优化器会估算IO成本。
CPU成本: 优化器还会考虑CPU成本，例如比较操作的成本。

在上面的例子中，优化器选择了customer_id_idx索引，可能是因为：

customer_id_idx索引的选择性更高，能够过滤掉更多的数据。
查询的条件customer_id = 123可以直接使用customer_id_idx索引。
优化器估算使用customer_id_idx索引的IO成本和CPU成本更低。

五、 rows_estimation：优化器的水晶球

rows_estimation是优化器中非常重要的一个环节。优化器需要估算每个操作会返回多少行数据，才能选择最佳的执行计划。如果优化器估算的行数不准确，就可能会选择错误的执行计划。

优化器估算行数的方法有很多，例如：

统计信息: 优化器会维护表的统计信息，例如表的行数、每个列的唯一值数量等等。
索引统计信息: 优化器还会维护索引的统计信息，例如索引的基数、索引的平均长度等等。
直方图: 直方图可以更准确地描述列的数据分布。
采样: 优化器可以对表进行采样，然后根据采样结果来估算行数。

在上面的例子中，我们可以看到rows_estimation部分包含了range_analysis，它分析了不同的索引，并估算了使用每个索引会返回多少行数据。

如果优化器估算的行数不准确，你可以尝试以下方法来解决：

更新统计信息: 使用ANALYZE TABLE命令更新表的统计信息。
使用FORCE INDEX提示: 强制优化器使用指定的索引。
重写SQL语句: 尝试重写SQL语句，让优化器更容易选择正确的执行计划。

六、优化器的陷阱：常见问题和解决方案

在使用Optimizer Trace的过程中，你可能会遇到一些常见的问题，例如：

全表扫描 (Full Table Scan)

有时候，优化器会选择全表扫描，即使表上有索引。这可能是因为：
- 索引的选择性太低: 如果索引的选择性太低，优化器可能会认为使用索引的成本比全表扫描更高。
- 查询的条件无法使用索引: 如果查询的条件无法使用索引，优化器就只能选择全表扫描。
- 表太小: 如果表太小，全表扫描可能比使用索引更快。
解决方案:
- 检查索引的选择性，如果选择性太低，可以考虑创建更合适的索引。
- 确保查询的条件能够使用索引。
- 如果表确实很小，可以考虑不创建索引。
索引合并 (Index Merge)

索引合并是指优化器同时使用多个索引来满足查询的条件。虽然索引合并在某些情况下可以提高性能，但在大多数情况下，索引合并的性能不如使用单个索引。

解决方案:
- 尽量避免使用索引合并，可以通过创建组合索引来替代索引合并。
- 如果必须使用索引合并，可以考虑调整optimizer_switch参数来控制索引合并的行为。
错误的行数估算 (Incorrect Row Estimation)

如果优化器估算的行数不准确，就可能会选择错误的执行计划。

解决方案:
- 更新表的统计信息，使用ANALYZE TABLE命令。
- 使用FORCE INDEX提示强制优化器使用指定的索引。
- 重写SQL语句，让优化器更容易选择正确的执行计划。

七、实战案例：优化慢查询

假设我们有一个users表，包含user_id, username, email等字段。我们执行以下查询：

SELECT * FROM users WHERE username LIKE '%abc%' AND email LIKE '%xyz%';

这条SQL语句执行起来非常慢。我们使用Optimizer Trace来分析一下：

SET optimizer_trace="enabled=on";
SET end_markers_in_json=on;
SELECT * FROM users WHERE username LIKE '%abc%' AND email LIKE '%xyz%';
SELECT * FROM `information_schema`.`OPTIMIZER_TRACE`G
SET optimizer_trace="enabled=off";

通过查看Trace结果，我们发现优化器选择了全表扫描，因为username和email字段上的LIKE '%abc%'条件无法使用索引。

解决方案:

由于LIKE '%abc%'条件无法使用索引，我们可以考虑使用全文索引 (Fulltext Index) 来优化查询。

创建全文索引:

ALTER TABLE users ADD FULLTEXT INDEX username_email_fulltext (username, email);

使用MATCH AGAINST查询:
```
SELECT * FROM users WHERE MATCH(username, email) AGAINST ('abc xyz' IN BOOLEAN MODE);
```
MATCH AGAINST 是全文索引的查询语法。IN BOOLEAN MODE 允许我们使用更灵活的搜索条件。

再次执行查询，速度明显提升。我们再次使用Optimizer Trace来分析，发现优化器已经使用了全文索引。

八、 Optimizer Trace的局限性

Optimizer Trace是一个强大的工具，但它也有一些局限性：

性能开销: 开启Optimizer Trace会带来一些性能开销，因此不建议在生产环境长时间开启。
输出复杂: Optimizer Trace的输出非常复杂，需要一定的学习成本才能理解。
无法修改优化器的行为: Optimizer Trace只能观察优化器的行为，无法修改优化器的行为。

九、总结

Optimizer Trace是MySQL中一个非常有用的工具，可以帮助你理解查询优化器的工作原理，诊断慢查询，并优化SQL语句。虽然Optimizer Trace的输出比较复杂，但只要掌握了基本原理，就能轻松地解读Trace结果，找到问题的根源。

希望今天的讲座对大家有所帮助！下次再见！

发表回复 取消回复

发表回复取消回复