MySQL的`Performance Schema`：如何监控SQL的执行阶段与性能瓶颈？ - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

好的，下面是关于MySQL Performance Schema监控SQL执行阶段与性能瓶颈的讲座内容。

MySQL Performance Schema：深入SQL执行监控与性能瓶颈分析

大家好！今天我们来深入探讨MySQL的Performance Schema，重点关注如何利用它来监控SQL的执行阶段并识别性能瓶颈。Performance Schema是一个强大的工具，能够帮助我们了解MySQL服务器内部的运行状况，从而优化SQL查询和数据库配置。

1. Performance Schema 概述

Performance Schema是MySQL服务器的一个内部工具，用于监控服务器的运行时性能。它通过收集各种事件（event）的统计信息，例如SQL语句的执行时间、锁的等待时间、I/O操作的次数等，来帮助我们了解服务器的瓶颈在哪里。与慢查询日志相比，Performance Schema提供了更细粒度的信息，并且对服务器的性能影响更小。

Performance Schema 默认是关闭的，需要手动开启。

1.1 启用 Performance Schema

要启用 Performance Schema，需要修改 MySQL 的配置文件（通常是 my.cnf 或 my.ini），并重启 MySQL 服务器。

[mysqld]
performance_schema=ON

重启后，可以使用以下 SQL 语句验证 Performance Schema 是否已启用：

SELECT @@performance_schema;

如果返回 1，则表示 Performance Schema 已启用。

1.2 Performance Schema 的主要组件

Performance Schema 主要由以下组件构成：

事件（Events）： 代表服务器内部发生的各种操作，例如SQL语句的执行、锁的等待、I/O操作等。
消费者（Consumers）： 负责将事件写入到 Performance Schema 的表中。
工具（Instruments）： 用于检测事件的发生。
设置（Setup Objects）： 用于控制哪些事件被检测和收集。

2. Performance Schema 关键表

Performance Schema 提供了大量的表，用于存储各种性能数据。其中，以下几个表对于监控 SQL 执行阶段和性能瓶颈尤为重要：

events_statements_current：当前正在执行的 SQL 语句的信息。
events_statements_history：最近执行的 SQL 语句的历史信息。
events_statements_history_long：保存更长时间的 SQL 语句历史信息（需要配置）。
events_waits_current：当前正在发生的等待事件的信息。
events_waits_history：最近发生的等待事件的历史信息。
events_waits_history_long：保存更长时间的等待事件历史信息（需要配置）。
events_stages_current：当前SQL执行的阶段信息。
events_stages_history：最近SQL执行阶段历史信息。
events_stages_history_long：保存更长时间的SQL执行阶段历史信息（需要配置）。
file_summary_by_event_name：按事件名称汇总的文件 I/O 信息。
socket_summary_by_event_name：按事件名称汇总的网络 I/O 信息。

2.1 events_statements 表

events_statements 表是 Performance Schema 中最重要的表之一，它记录了 SQL 语句的执行信息。

EVENT_ID: 事件ID，唯一标识一个事件。
THREAD_ID: 执行该语句的线程ID。
EVENT_NAME: 事件名称，通常是 statement/sql/statement。
SOURCE: 执行语句的源文件和行号。
TIMER_START: 事件开始时间。
TIMER_END: 事件结束时间。
TIMER_WAIT: 事件持续时间（以皮秒为单位）。
SQL_TEXT: SQL 语句的文本。
DIGEST: SQL 语句的摘要，用于将相似的 SQL 语句分组。
DIGEST_TEXT: SQL 语句的摘要文本。
CURRENT_SCHEMA: 当前数据库。
ROWS_AFFECTED: 受影响的行数。
ROWS_SENT: 发送的行数。
ROWS_EXAMINED: 检查的行数。
CREATED_TMP_DISK_TABLES: 创建的磁盘临时表的数量。
CREATED_TMP_TABLES: 创建的内存临时表的数量。
SELECT_FULL_JOIN: 是否使用了全连接。
SELECT_FULL_RANGE_JOIN: 是否使用了全范围连接。
SELECT_RANGE: 是否使用了范围扫描。
SELECT_RANGE_CHECK: 是否使用了范围检查。
SELECT_SCAN: 是否使用了全表扫描。
SORT_MERGE_PASSES: 排序合并的次数。
SORT_RANGE: 是否使用了范围排序。
SORT_ROWS: 排序的行数。
SORT_SCAN: 是否使用了全表排序。
NO_INDEX_USED: 是否没有使用索引。
NO_GOOD_INDEX_USED: 是否没有使用好的索引。
WARNINGS: 警告的数量。
ERRORS: 错误的数量。
FIRST_SEEN: 首次执行时间。
LAST_SEEN: 最后一次执行时间。
EXECUTE_COUNT: 执行次数。
LOCK_TIME: 总锁等待时间。
SUM_ERRORS: 错误总数。
SUM_WARNINGS: 警告总数。
SUM_ROWS_AFFECTED: 总影响行数。
SUM_ROWS_SENT: 总发送行数。
SUM_ROWS_EXAMINED: 总检查行数。
SUM_CREATED_TMP_DISK_TABLES: 总创建磁盘临时表数。
SUM_CREATED_TMP_TABLES: 总创建内存临时表数。
SUM_SELECT_FULL_JOIN: 总全连接数。
SUM_SELECT_FULL_RANGE_JOIN: 总全范围连接数。
SUM_SELECT_RANGE: 总范围扫描数。
SUM_SELECT_RANGE_CHECK: 总范围检查数。
SUM_SELECT_SCAN: 总全表扫描数。
SUM_SORT_MERGE_PASSES: 总排序合并数。
SUM_SORT_RANGE: 总范围排序数。
SUM_SORT_ROWS: 总排序行数。
SUM_SORT_SCAN: 总全表排序数。
SUM_NO_INDEX_USED: 总未使用索引数。
SUM_NO_GOOD_INDEX_USED: 总未使用好索引数。
COUNT_STAR: 事件总数。
SUM_TIMER_WAIT: 总等待时间。
MIN_TIMER_WAIT: 最小等待时间。
AVG_TIMER_WAIT: 平均等待时间。
MAX_TIMER_WAIT: 最大等待时间。
SUM_LOCK_TIME: 总锁时间。
SUM_ERRORS: 总错误数。
SUM_WARNINGS: 总警告数。
QUERY_SAMPLE_TEXT: 查询样本文本。
QUERY_SAMPLE_SEEN: 查询样本时间。
QUERY_SAMPLE_TIMER_WAIT: 查询样本等待时间。

2.2 events_waits 表

events_waits 表记录了等待事件的信息，例如锁的等待、I/O 的等待等。

EVENT_ID: 事件ID，唯一标识一个事件。
THREAD_ID: 执行该语句的线程ID。
EVENT_NAME: 事件名称，例如 wait/synch/mutex/sql/TC_LOG_mutex。
SOURCE: 执行语句的源文件和行号。
TIMER_START: 事件开始时间。
TIMER_END: 事件结束时间。
TIMER_WAIT: 事件持续时间（以皮秒为单位）。
OBJECT_INSTANCE_BEGIN: 对象实例开始的内存地址。
NESTING_EVENT_ID: 嵌套事件ID。
NESTING_EVENT_TYPE: 嵌套事件类型。
OPERATION: 操作名称。
NUMBER_OF_BYTES: 字节数。
FLAGS: 标志。

2.3 events_stages 表

events_stages 表记录了 SQL 语句执行的各个阶段，例如 preparing、optimizing、executing 等。

EVENT_ID: 事件ID，唯一标识一个事件。
THREAD_ID: 执行该语句的线程ID。
EVENT_NAME: 事件名称，通常是 stage/sql/xxx，例如 stage/sql/preparing。
SOURCE: 执行语句的源文件和行号。
TIMER_START: 事件开始时间。
TIMER_END: 事件结束时间。
TIMER_WAIT: 事件持续时间（以皮秒为单位）。
NESTING_EVENT_ID: 嵌套事件ID。
NESTING_EVENT_TYPE: 嵌套事件类型。

3. 监控 SQL 执行阶段

通过 events_stages 表，我们可以了解 SQL 语句执行的各个阶段的耗时情况。以下是一个示例查询，用于显示最近执行的 SQL 语句的执行阶段信息：

SELECT
    es.EVENT_ID,
    es.THREAD_ID,
    es.EVENT_NAME,
    es.TIMER_WAIT,
    (SELECT SQL_TEXT FROM performance_schema.events_statements_history ess WHERE ess.EVENT_ID = es.NESTING_EVENT_ID) AS SQL_TEXT
FROM
    performance_schema.events_stages_history es
ORDER BY
    es.EVENT_ID DESC
LIMIT 10;

这个查询会显示最近 10 条 SQL 语句的执行阶段信息，包括事件 ID、线程 ID、事件名称、耗时以及 SQL 语句的文本。

通过分析这些信息，我们可以确定 SQL 语句的瓶颈在哪里。例如，如果 stage/sql/executing 阶段的耗时很长，则表示 SQL 语句的执行效率较低，可能需要优化 SQL 语句或者索引。如果stage/sql/preparing阶段耗时很长，可能需要考虑参数化查询。

4. 识别性能瓶颈

除了监控 SQL 执行阶段，Performance Schema 还可以帮助我们识别其他性能瓶颈，例如锁的等待、I/O 的等待等。

4.1 锁的等待

通过 events_waits 表，我们可以了解锁的等待情况。以下是一个示例查询，用于显示锁的等待信息：

SELECT
    ew.EVENT_ID,
    ew.THREAD_ID,
    ew.EVENT_NAME,
    ew.TIMER_WAIT,
    (SELECT SQL_TEXT FROM performance_schema.events_statements_history ess WHERE ess.EVENT_ID = ew.NESTING_EVENT_ID) AS SQL_TEXT
FROM
    performance_schema.events_waits_history ew
WHERE
    ew.EVENT_NAME LIKE 'wait/lock/table/%'
ORDER BY
    ew.TIMER_WAIT DESC
LIMIT 10;

这个查询会显示最近 10 条锁的等待事件的信息，包括事件 ID、线程 ID、事件名称、耗时以及 SQL 语句的文本。通过分析这些信息，我们可以确定哪些 SQL 语句在等待锁，从而优化 SQL 语句或者调整锁的策略。

4.2 I/O 的等待

通过 file_summary_by_event_name 和 socket_summary_by_event_name 表，我们可以了解 I/O 的等待情况。以下是一个示例查询，用于显示文件 I/O 的信息：

SELECT
    EVENT_NAME,
    COUNT_STAR,
    SUM_TIMER_WAIT,
    SUM_NUMBER_OF_BYTES
FROM
    performance_schema.file_summary_by_event_name
ORDER BY
    SUM_TIMER_WAIT DESC
LIMIT 10;

这个查询会显示文件 I/O 的统计信息，包括事件名称、事件数量、总耗时以及总字节数。通过分析这些信息，我们可以确定哪些文件 I/O 操作比较耗时，从而优化磁盘配置或者调整 I/O 策略。

5. Performance Schema 配置

Performance Schema 的配置非常重要，它决定了哪些事件被检测和收集。不合理的配置可能会导致 Performance Schema 占用过多的资源，影响服务器的性能。

5.1 控制事件的检测

通过修改 setup_instruments 表，我们可以控制哪些事件被检测。例如，要禁用 statement/sql/select 事件的检测，可以执行以下 SQL 语句：

UPDATE performance_schema.setup_instruments
SET ENABLED = 'NO', TIMED = 'NO'
WHERE NAME = 'statement/sql/select';

5.2 控制事件的收集

通过修改 setup_consumers 表，我们可以控制哪些事件被收集。例如，要禁用将事件写入到 events_statements_history 表，可以执行以下 SQL 语句：

UPDATE performance_schema.setup_consumers
SET ENABLED = 'NO'
WHERE NAME = 'events_statements_history';

5.3 调整表的大小

Performance Schema 的表是内存表，大小是固定的。如果表的大小不够，可能会导致一些事件丢失。可以通过修改 performance_schema_events_statements_history_size、performance_schema_events_waits_history_size 等参数来调整表的大小。例如，要将 events_statements_history 表的大小设置为 1000，可以修改 MySQL 的配置文件：

[mysqld]
performance_schema_events_statements_history_size=1000

然后重启 MySQL 服务器。

6. 代码示例：使用存储过程分析SQL性能

为了方便分析，我们可以创建一个存储过程，将常用的查询封装起来。

DELIMITER //

CREATE PROCEDURE AnalyzeSQLPerformance(IN sql_digest VARCHAR(32))
BEGIN
    -- 查询SQL语句的基本信息
    SELECT
        DIGEST_TEXT,
        COUNT_STAR,
        SUM_TIMER_WAIT,
        AVG_TIMER_WAIT,
        MAX_TIMER_WAIT,
        SUM_ROWS_AFFECTED,
        SUM_ROWS_SENT,
        SUM_ROWS_EXAMINED
    FROM
        performance_schema.events_statements_summary_by_digest
    WHERE
        DIGEST = sql_digest;

    -- 查询SQL语句的执行阶段信息
    SELECT
        EVENT_NAME,
        COUNT_STAR,
        SUM_TIMER_WAIT,
        AVG_TIMER_WAIT,
        MAX_TIMER_WAIT
    FROM
        performance_schema.stage_summary_by_event_name
    WHERE
        EVENT_NAME LIKE 'stage/sql/%'
        AND DIGEST = sql_digest;

    -- 查询SQL语句的等待事件信息
    SELECT
        EVENT_NAME,
        COUNT_STAR,
        SUM_TIMER_WAIT,
        AVG_TIMER_WAIT,
        MAX_TIMER_WAIT
    FROM
        performance_schema.wait_summary_by_event_name
    WHERE
        EVENT_NAME LIKE 'wait/%'
        AND DIGEST = sql_digest
    ORDER BY SUM_TIMER_WAIT DESC;
END //

DELIMITER ;

使用这个存储过程，我们可以方便地分析指定 SQL 语句的性能。例如，要分析 f324a7b7e5a2e7f098c6f0e3d9d9c3b4 这个 SQL 语句的性能，可以执行以下 SQL 语句：

CALL AnalyzeSQLPerformance('f324a7b7e5a2e7f098c6f0e3d9d9c3b4');

7. 注意事项

Performance Schema 会占用一定的资源，特别是内存。因此，需要根据服务器的实际情况进行配置，避免影响服务器的性能。
Performance Schema 的数据是动态的，会随着服务器的运行而变化。因此，需要定期收集和分析数据，才能及时发现性能瓶颈。
Performance Schema 提供了大量的表和列，需要仔细研究文档，才能充分利用它的功能。

8. 总结

Performance Schema 是一个强大的工具，能够帮助我们监控 SQL 的执行阶段并识别性能瓶颈。通过合理地配置和使用 Performance Schema，我们可以深入了解 MySQL 服务器的运行状况，从而优化 SQL 查询和数据库配置，提高服务器的性能。掌握 Performance Schema 的使用，是每一个 MySQL DBA 和开发人员必备的技能。

9. 如何更有效地应用这些技术

理解 Performance Schema 的原理、熟悉关键表结构和灵活运用 SQL 查询，是有效监控和分析 SQL 性能的基础。希望今天的分享能够帮助大家更好地利用 Performance Schema，提升 MySQL 数据库的性能和稳定性。