优化 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

2025年8月31日

MySQL优化器与执行计划之：`MySQL`的`排序优化`：`Using filesort`的避免策略和`Sort Buffer`的调优。

好的，下面是一篇关于MySQL排序优化的技术文章，以讲座模式呈现，包含代码示例、逻辑分析以及避免Using filesort和优化Sort Buffer的策略。 MySQL排序优化：避免Using filesort和Sort Buffer调优大家好！今天我们来深入探讨MySQL查询优化中的一个关键环节：排序优化。当我们的查询需要对结果进行排序时，MySQL优化器会尽力选择最佳的排序策略。然而，有时优化器会选择Using filesort，这意味着MySQL需要在磁盘上进行排序，这通常会导致性能显著下降。此外，即使没有Using filesort，Sort Buffer的配置也会直接影响排序的效率。今天我们将详细讲解如何避免Using filesort，以及如何优化Sort Buffer。 1. 了解Using filesort 1.1 什么是Using filesort？ Using filesort是MySQL EXPLAIN语句输出中的一个关键词，表示MySQL无法使用索引来满足ORDER BY子句的要求，因此需要在内存或磁盘上进行额外的排序操作。这通常是性能瓶颈。 1.2 U …

继续阅读“MySQL优化器与执行计划之：`MySQL`的`排序优化`：`Using filesort`的避免策略和`Sort Buffer`的调优。”

2025年8月31日

MySQL优化器与执行计划之：`MySQL`的`连接优化`：`BNL`（`Block Nested-Loop`）和`BKA`（`Batched Key Access`）的底层算法。

MySQL连接优化：BNL与BKA算法深入解析大家好，今天我们来深入探讨MySQL连接优化中两种重要的算法：Block Nested-Loop (BNL) 和 Batched Key Access (BKA)。理解这两种算法的工作原理，有助于我们更好地编写高效的SQL查询，避免性能陷阱。 1. 连接操作的基础与挑战在关系型数据库中，连接操作是构建复杂查询的核心。它允许我们基于一个或多个共同列，将来自多个表的数据组合在一起。最简单的连接操作是Nested-Loop Join，但当表的数据量很大时，它的效率会急剧下降。 Nested-Loop Join (NLJ) 的基本原理： NLJ算法遍历外表（驱动表）的每一行，然后内表（被驱动表）扫描每一行，比较连接条件。如果匹配，则合并两行并输出结果。 — 示例：两个表 employees 和 departments，连接条件是 employees.department_id = departments.id SELECT * FROM employees e JOIN departments d ON e.department_id = d …

继续阅读“MySQL优化器与执行计划之：`MySQL`的`连接优化`：`BNL`（`Block Nested-Loop`）和`BKA`（`Batched Key Access`）的底层算法。”

2025年8月31日

MySQL优化器与执行计划之：`MySQL`的`子查询优化`：从`Dependant Subquery`到`Semi-Join`的优化策略。

MySQL子查询优化：从Dependent Subquery到Semi-Join 大家好，今天我们来深入探讨MySQL数据库中子查询的优化策略，特别是从Dependent Subquery（依赖子查询）到Semi-Join的优化过程。子查询是SQL查询中一种强大的工具，但如果使用不当，可能会导致性能问题。理解MySQL如何优化子查询对于编写高效的SQL至关重要。什么是子查询？子查询，顾名思义，就是一个嵌套在另一个查询语句内部的查询。它可以出现在SELECT、FROM、WHERE、HAVING等子句中。示例： SELECT employee_name FROM employees WHERE department_id IN (SELECT department_id FROM departments WHERE location = ‘New York’); 在这个例子中，(SELECT department_id FROM departments WHERE location = ‘New York’) 就是一个子查询。它返回所有位于New York的部门的ID，然后外部查询 …

继续阅读“MySQL优化器与执行计划之：`MySQL`的`子查询优化`：从`Dependant Subquery`到`Semi-Join`的优化策略。”

2025年8月31日

MySQL优化器与执行计划之：`MySQL`的`索引选择`：优化器如何选择最合适的索引，以及`Index Merge`的原理。

MySQL 优化器与执行计划：索引选择与 Index Merge 各位朋友，大家好！今天我们来深入探讨 MySQL 优化器中的一个核心环节：索引选择。好的索引能够显著提升查询性能，而选择错误的索引甚至可能导致性能下降。我们将详细分析优化器如何选择最合适的索引，以及一种特殊的索引使用方式—— Index Merge 的原理和适用场景。一、MySQL 优化器概览首先，我们简单回顾一下 MySQL 查询的生命周期，以及优化器在其中的作用。客户端发送查询请求：用户通过客户端向 MySQL 服务器发送 SQL 查询语句。连接器处理：连接器负责处理客户端连接，进行身份验证和权限校验。查询缓存（已移除）：在 MySQL 8.0 之前，如果查询命中缓存，则直接返回结果。MySQL 8.0 彻底移除了查询缓存功能。解析器解析 SQL：解析器将 SQL 语句解析成抽象语法树（AST）。预处理器处理：预处理器进行语法检查、权限验证等操作。优化器优化查询：优化器是整个查询过程中最关键的模块之一。它负责生成多个执行计划，并选择其中最优的一个。优化策略包括：索引选择：决定使用哪个索 …

继续阅读“MySQL优化器与执行计划之：`MySQL`的`索引选择`：优化器如何选择最合适的索引，以及`Index Merge`的原理。”

2025年8月28日

MySQL性能优化与索引之：`MySQL`的`lock-free`优化：`innodb_online_alter_table`的底层实现。

好的，我们开始今天的讲座，主题是“MySQL性能优化与索引之：MySQL的lock-free优化：innodb_online_alter_table的底层实现”。引言：为什么需要在线DDL 在生产环境中，对数据库表结构进行更改（DDL，Data Definition Language）是一项常见的任务，例如添加索引、修改列类型等。传统的DDL操作会阻塞整个表，导致这段时间内无法进行读写操作，从而严重影响业务的可用性。这种阻塞被称为“锁表”，在业务高峰期是不可接受的。为了解决这个问题，MySQL 5.6 引入了在线 DDL (Online DDL) 的概念，允许在执行 DDL 操作的同时，仍然可以进行读写操作，从而最大程度地减少对业务的影响。innodb_online_alter_table 就是控制 InnoDB 存储引擎是否使用在线 DDL 的参数。 innodb_online_alter_table 参数详解 innodb_online_alter_table 参数控制着 InnoDB 如何执行 ALTER TABLE 操作。它是一个字符串类型的参数，可以包含多个选项，每个选项 …

继续阅读“MySQL性能优化与索引之：`MySQL`的`lock-free`优化：`innodb_online_alter_table`的底层实现。”

2025年8月28日

MySQL性能优化与索引之：`MySQL`的`in`和`exists`子查询优化：其在查询中的底层转换。

MySQL性能优化与索引之：MySQL的in和exists子查询优化：其在查询中的底层转换大家好，今天我们来深入探讨MySQL中IN和EXISTS子查询的优化，并剖析它们在查询执行过程中可能发生的底层转换。IN和EXISTS看似简单，但在处理大数据量时，性能差异可能非常显著。理解它们的行为和优化策略，对于编写高效的SQL语句至关重要。 1. IN 和 EXISTS 的基本概念首先，我们回顾一下IN和EXISTS的基本用法： IN 子查询: 用于判断某个值是否存在于子查询的结果集中。 SELECT column1 FROM table1 WHERE column2 IN (SELECT column2 FROM table2 WHERE condition); EXISTS 子查询: 用于判断子查询的结果集是否为空。只要子查询返回至少一行数据，EXISTS 就返回 TRUE，否则返回 FALSE。 SELECT column1 FROM table1 WHERE EXISTS (SELECT 1 FROM table2 WHERE table1.column2 = table2.co …

继续阅读“MySQL性能优化与索引之：`MySQL`的`in`和`exists`子查询优化：其在查询中的底层转换。”

2025年8月28日

MySQL性能优化与索引之：`MySQL`的`limit`分页优化：如何避免全表扫描。

MySQL limit 分页优化：如何避免全表扫描大家好，今天我们来聊聊 MySQL 中 limit 分页优化。分页是 Web 应用中非常常见的功能，当数据量较大时，如果没有正确地使用 limit，很容易导致性能问题，特别是全表扫描。本次讲座将深入探讨 limit 的工作原理、常见的性能问题以及多种优化策略，并结合实际的代码示例进行说明。 1. limit 的基本原理和常见问题 limit 子句用于限制查询结果返回的行数。其基本语法如下： SELECT * FROM table_name LIMIT offset, row_count; 其中： offset：指定从哪一行开始返回结果，它的值从 0 开始计数。 row_count：指定返回的行数。如果没有指定 offset，则默认从第一行开始返回结果。常见问题：深度分页性能瓶颈当 offset 值非常大时，比如 limit 1000000, 10，MySQL 需要先扫描 1000000 行数据，然后丢弃这些数据，最后返回后面的 10 行。这导致了大量的 I/O 开销和 CPU 资源浪费，极大地降低了查询效率。这就是我们常说的深度 …

继续阅读“MySQL性能优化与索引之：`MySQL`的`limit`分页优化：如何避免全表扫描。”

2025年8月28日

MySQL性能优化与索引之：`MySQL`的`count(*)`优化：其在`MyISAM`和`InnoDB`中的实现差异。

MySQL 性能优化与索引：COUNT(*) 优化，MyISAM 与 InnoDB 的实现差异各位朋友，大家好！今天我们来聊聊 MySQL 中一个看似简单，实则暗藏玄机的函数：COUNT(*)。特别是它在 MyISAM 和 InnoDB 两种存储引擎下的实现差异，以及如何针对性地进行优化。 COUNT(*) 的作用很简单，就是统计表中的行数。但在高并发、大数据量的场景下，不合理的 COUNT(*) 使用可能会成为性能瓶颈。理解其内部机制，才能更好地避免问题，提升性能。 *1. `COUNT()` 的基本原理** 首先，我们需要明确 COUNT(*) 到底做了什么。简单来说，COUNT(*) 会扫描整个表，统计满足条件的行数（如果没有 WHERE 子句，则统计所有行）。但具体扫描的方式，以及是否需要读取数据，取决于存储引擎和查询的具体形式。 *2. MyISAM 存储引擎下的 `COUNT()`** MyISAM 存储引擎的一个显著特点是，它会维护一个专门的计数器，用于记录表的总行数。因此，在执行不带 WHERE 子句的 COUNT(*) 查询时，MyISAM 可以直接从计数器中读取 …

继续阅读“MySQL性能优化与索引之：`MySQL`的`count(*)`优化：其在`MyISAM`和`InnoDB`中的实现差异。”

2025年8月28日

MySQL性能优化与索引之：`MySQL`的大表优化：分库分表、归档和分区表的选择。

MySQL 大表优化：分库分表、归档和分区表的选择大家好，今天我们来聊聊 MySQL 大表优化。随着业务的发展，数据量会不断增长，单表的数据量达到百万甚至千万级别时，查询效率会显著下降，甚至会影响整个系统的性能。因此，我们需要对大表进行优化。常见的优化手段包括分库分表、数据归档和分区表。那么，面对不同的场景，我们应该如何选择合适的方案呢？一、了解大表带来的问题首先，我们需要明确大表会带来哪些问题：查询效率降低：扫描大量数据，导致查询速度慢。索引失效：索引维护成本高，索引效果下降。锁竞争激烈：并发读写操作争夺锁资源，导致性能瓶颈。备份恢复困难：备份和恢复时间过长，影响业务连续性。硬件资源消耗：占用大量的磁盘空间和内存资源。二、分库分表分库分表是将一个大表的数据分散到多个数据库或多个表中，从而降低单表的数据量，提高查询效率。 1. 水平分表 (Sharding): 将一个大表的数据按照某种规则分散到多个结构相同的表中。例如，按照用户ID进行哈希取模，将用户数据分散到不同的用户表中。优点：降低单表数据量，提高查询效率。缓解锁竞争，提高并发能力。更容易 …

继续阅读“MySQL性能优化与索引之：`MySQL`的大表优化：分库分表、归档和分区表的选择。”

2025年8月28日

MySQL性能优化与索引之：`MySQL`的`Group By`优化：如何利用索引避免临时表。

MySQL Group By 优化：利用索引避免临时表大家好，今天我们来聊聊 MySQL 的 GROUP BY 优化，重点在于如何利用索引来避免临时表的产生，从而提升查询性能。GROUP BY 是 SQL 中一个非常常用的操作，用于将数据按照一个或多个列进行分组，然后进行聚合计算。但是，如果 GROUP BY 使用不当，很容易导致 MySQL 创建临时表，这会极大地降低查询效率。理解临时表与 GROUP BY 在执行 GROUP BY 查询时，MySQL 需要对数据进行排序和分组。如果没有合适的索引，MySQL 可能会选择以下两种方式：使用文件排序 (filesort)：将所有需要分组的数据读取到内存或者磁盘中，然后进行排序，最后进行分组。这种方式效率非常低，尤其是在数据量很大的情况下。创建临时表 (temporary table)：创建一个临时表，将需要分组的数据插入到临时表中，并在临时表上进行排序和分组。这种方式比文件排序稍微好一些，但是仍然会消耗大量的资源。什么情况下会产生临时表？ GROUP BY 的列没有索引。 GROUP BY 的列不是索引的最左前缀。 ORDER …

继续阅读“MySQL性能优化与索引之：`MySQL`的`Group By`优化：如何利用索引避免临时表。”