MySQL高阶讲座之：`MySQL`的`Performance Schema`：如何编写查询以定位`I/O`、`CPU`和锁等待瓶颈。 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

各位观众老爷，大家好！我是今天的主讲人，江湖人称“MySQL小诸葛”，专门负责给大家诊断数据库疑难杂症。今天咱们聊聊MySQL的Performance Schema，保证让大家以后看到数据库慢，不再抓瞎！

Performance Schema，顾名思义，就是MySQL的性能模式，它就像一个隐藏在数据库深处的“性能雷达”，专门用来监控MySQL服务器的各种性能指标。有了它，咱们就能轻松定位I/O、CPU和锁等待这些让人头疼的瓶颈。

一、Performance Schema 是个啥？（What is Performance Schema?）

Performance Schema 是 MySQL 5.5 版本引入的一个性能监控工具，它收集了数据库服务器运行时的各种低级别事件信息。这些信息包括：

事件（Events）： 数据库执行的各种操作，比如 SQL 语句执行、锁的获取与释放、I/O 操作等等。
性能指标（Performance Metrics）： CPU 使用率、内存使用情况、I/O 等待时间等等。

说白了，Performance Schema 就像一个超级记事本，把 MySQL 服务器干的每一件事都记录下来。只不过，这个记事本里的信息有点“专业”，需要咱们用特定的 SQL 语句才能解读。

二、Performance Schema 怎么用？（How to Use Performance Schema?）

Performance Schema 默认是开启的，但有时候可能因为配置问题被禁用。我们可以通过以下 SQL 语句检查 Performance Schema 是否启用：

SELECT @@performance_schema;

如果结果是 1，说明 Performance Schema 已经启用。如果是 0，则需要手动启用：

SET GLOBAL performance_schema = 1;

注意：启用 Performance Schema 会带来一定的性能开销，但通常可以忽略不计。

Performance Schema的数据存储在多个表中，这些表按照不同的监控维度进行组织。常用的表包括：

events_statements_summary_by_digest：按SQL语句摘要统计执行信息。
events_waits_summary_global_by_event_name：按事件名统计全局等待信息。
file_summary_by_event_name：按事件名统计文件I/O信息。
memory_summary_global_by_event_name：按事件名统计内存使用信息。
threads：当前线程信息。

三、定位 I/O 瓶颈（Identifying I/O Bottlenecks）

I/O 瓶颈通常是指数据库服务器在读写磁盘时花费了大量时间。这可能是因为磁盘速度慢、数据量太大、或者 SQL 语句执行效率低下等等原因。

1. 找出慢速 I/O 操作

我们可以通过 file_summary_by_event_name 表来找出慢速 I/O 操作：

SELECT
    EVENT_NAME,
    COUNT_STAR,
    SUM_TIMER_WAIT,
    AVG_TIMER_WAIT
FROM
    performance_schema.file_summary_by_event_name
WHERE
    EVENT_NAME LIKE 'wait/io/file/%'
ORDER BY
    SUM_TIMER_WAIT DESC
LIMIT 10;

这条 SQL 语句会列出最耗时的 I/O 事件，包括事件名称、发生次数、总等待时间和平均等待时间。

EVENT_NAME	COUNT_STAR	SUM_TIMER_WAIT	AVG_TIMER_WAIT
wait/io/file/innodb/innodb_data_file	12345	1234567890123	123456789
wait/io/file/innodb/innodb_log_file	67890	6789012345678	678901234
wait/io/file/sql/binlog	1234	123456789012	123456789

从结果中，我们可以看到 innodb_data_file 和 innodb_log_file 是最耗时的 I/O 操作。这说明 InnoDB 数据文件和日志文件的读写速度可能存在问题。

2. 分析特定文件的 I/O 情况

如果我们想进一步分析某个特定文件的 I/O 情况，可以使用 file_instances 表：

SELECT
    FILE_NAME,
    EVENT_NAME,
    COUNT_STAR,
    SUM_TIMER_WAIT,
    AVG_TIMER_WAIT
FROM
    performance_schema.file_instances
WHERE
    FILE_NAME LIKE '%/your_table.ibd' -- 替换成你的表空间文件路径
ORDER BY
    SUM_TIMER_WAIT DESC
LIMIT 10;

这条 SQL 语句会列出指定文件的 I/O 事件，包括文件名、事件名称、发生次数、总等待时间和平均等待时间。

3. 可能的解决方案

升级磁盘： 如果磁盘速度太慢，可以考虑升级到 SSD 固态硬盘。
优化 SQL 语句： 避免全表扫描，尽量使用索引。
调整 InnoDB 配置： 调整 innodb_buffer_pool_size、innodb_log_file_size 等参数，可以提高 I/O 性能。

四、定位 CPU 瓶颈（Identifying CPU Bottlenecks）

CPU 瓶颈通常是指数据库服务器的 CPU 使用率过高，导致 SQL 语句执行缓慢。

1. 找出 CPU 消耗高的 SQL 语句

我们可以通过 events_statements_summary_by_digest 表来找出 CPU 消耗高的 SQL 语句：

SELECT
    DIGEST_TEXT,
    COUNT_STAR,
    SUM_TIMER_WAIT,
    SUM_CPU_WAIT,
    AVG_TIMER_WAIT,
    AVG_CPU_WAIT
FROM
    performance_schema.events_statements_summary_by_digest
ORDER BY
    SUM_CPU_WAIT DESC
LIMIT 10;

这条 SQL 语句会列出 CPU 消耗最高的 SQL 语句，包括 SQL 语句摘要、执行次数、总执行时间、总 CPU 时间、平均执行时间和平均 CPU 时间。

DIGEST_TEXT	COUNT_STAR	SUM_TIMER_WAIT	SUM_CPU_WAIT	AVG_TIMER_WAIT	AVG_CPU_WAIT
SELECT * FROM your_table WHERE column = ?	12345	1234567890123	123456789	123456789	12345
UPDATE your_table SET column = ? WHERE id = ?	67890	6789012345678	67890123	678901234	6789

从结果中，我们可以看到哪些 SQL 语句消耗了大量的 CPU 资源。

2. 查看 SQL 语句的详细信息

如果我们想查看某个 SQL 语句的详细信息，可以使用 events_statements_history_long 表：

SELECT
    SQL_TEXT,
    CURRENT_SCHEMA,
    TIMER_WAIT,
    CPU_TIME
FROM
    performance_schema.events_statements_history_long
WHERE
    DIGEST = 'your_sql_digest' -- 替换成你的 SQL 语句摘要
ORDER BY
    TIMER_WAIT DESC
LIMIT 10;

这条 SQL 语句会列出指定 SQL 语句的详细信息，包括 SQL 语句内容、数据库名称、执行时间和 CPU 时间。

3. 可能的解决方案

优化 SQL 语句： 避免复杂的 JOIN 操作，尽量使用索引。
增加 CPU 核心数： 如果 CPU 负载过高，可以考虑增加 CPU 核心数。
升级数据库服务器： 如果数据库服务器配置太低，可以考虑升级到更高配置的服务器。

五、定位锁等待瓶颈（Identifying Lock Wait Bottlenecks）

锁等待瓶颈通常是指数据库服务器在获取锁时花费了大量时间，导致 SQL 语句执行缓慢。

1. 找出锁等待事件

我们可以通过 events_waits_summary_global_by_event_name 表来找出锁等待事件：

SELECT
    EVENT_NAME,
    COUNT_STAR,
    SUM_TIMER_WAIT,
    AVG_TIMER_WAIT
FROM
    performance_schema.events_waits_summary_global_by_event_name
WHERE
    EVENT_NAME LIKE 'wait/lock/%'
ORDER BY
    SUM_TIMER_WAIT DESC
LIMIT 10;

这条 SQL 语句会列出锁等待事件，包括事件名称、发生次数、总等待时间和平均等待时间。

EVENT_NAME	COUNT_STAR	SUM_TIMER_WAIT	AVG_TIMER_WAIT
wait/lock/table/sql/handler	12345	1234567890123	123456789
wait/lock/metadata/sql/mdl	67890	6789012345678	678901234

从结果中，我们可以看到哪些锁等待事件最耗时。

2. 查看锁等待的详细信息

我们可以通过 events_waits_current 表来查看当前正在发生的锁等待事件：

SELECT
    THREAD_ID,
    EVENT_NAME,
    OBJECT_SCHEMA,
    OBJECT_NAME,
    INDEX_NAME,
    SOURCE,
    TIMER_WAIT
FROM
    performance_schema.events_waits_current
WHERE
    EVENT_NAME LIKE 'wait/lock/%'
ORDER BY
    TIMER_WAIT DESC
LIMIT 10;

这条 SQL 语句会列出当前正在发生的锁等待事件，包括线程 ID、事件名称、数据库名称、表名、索引名称、源代码和等待时间。

3. 找出持有锁的线程

我们可以通过 threads 表来找出持有锁的线程：

SELECT
    THREAD_ID,
    NAME,
    PROCESSLIST_ID,
    PROCESSLIST_USER,
    PROCESSLIST_HOST,
    PROCESSLIST_DB,
    PROCESSLIST_COMMAND,
    PROCESSLIST_TIME,
    PROCESSLIST_STATE,
    PROCESSLIST_INFO
FROM
    performance_schema.threads
WHERE
    THREAD_ID IN (SELECT THREAD_ID FROM performance_schema.events_waits_current WHERE EVENT_NAME LIKE 'wait/lock/%');

这条 SQL 语句会列出持有锁的线程的详细信息，包括线程 ID、名称、进程 ID、用户名、主机名、数据库名称、命令、执行时间、状态和 SQL 语句。

4. 可能的解决方案

优化事务： 尽量缩短事务的执行时间，避免长时间持有锁。
减少锁的粒度： 尽量使用行锁，避免使用表锁。
调整锁等待超时时间： 调整 innodb_lock_wait_timeout 参数，可以避免长时间的锁等待。
避免死锁： 确保事务按照相同的顺序获取锁，避免死锁的发生。

六、总结（Conclusion）

Performance Schema 是一个强大的性能监控工具，可以帮助我们定位 I/O、CPU 和锁等待等瓶颈。通过分析 Performance Schema 的数据，我们可以找出性能问题的根源，并采取相应的措施来优化数据库性能。

一些小技巧：

善用 WHERE 子句： 在查询 Performance Schema 表时，尽量使用 WHERE 子句来过滤数据，避免扫描大量无用数据。
合理使用 LIMIT 子句： 在查询 Performance Schema 表时，尽量使用 LIMIT 子句来限制返回结果的数量，避免一次性返回大量数据。
定期清理 Performance Schema 数据： Performance Schema 会不断记录数据，时间长了可能会占用大量磁盘空间。我们可以定期清理 Performance Schema 数据，保持数据库的性能。

举个例子：

假设你发现数据库的 CPU 使用率很高，但是不知道是哪些 SQL 语句导致的。你可以使用以下 SQL 语句来找出 CPU 消耗最高的 SQL 语句：

SELECT
    DIGEST_TEXT,
    COUNT_STAR,
    SUM_TIMER_WAIT,
    SUM_CPU_WAIT,
    AVG_TIMER_WAIT,
    AVG_CPU_WAIT
FROM
    performance_schema.events_statements_summary_by_digest
ORDER BY
    SUM_CPU_WAIT DESC
LIMIT 10;

然后，你可以针对这些 SQL 语句进行优化，比如添加索引、优化查询逻辑等等。

最后的最后，记住一点：

Performance Schema 虽然强大，但也要灵活运用。不同的场景需要使用不同的 SQL 语句来分析数据。希望今天的讲座能帮助大家更好地理解和使用 Performance Schema，让你的数据库性能飞起来！

感谢大家收听！如果有什么问题，欢迎在评论区留言，我会尽力解答。下次有机会再见！

发表回复 取消回复

发表回复取消回复