智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座 -

2025年9月6日

`WHERE`条件的`下推`（`Predicate Pushdown`）：`存储引擎`如何`过滤`数据`以减少`传输`。

WHERE 条件下推：存储引擎的数据过滤优化大家好，今天我们来深入探讨数据库查询优化中一个非常重要的技术：WHERE条件的下推（Predicate Pushdown）。这个技术的核心思想是将查询语句中的WHERE条件尽可能地“推”到存储引擎层执行，从而在数据读取的源头就过滤掉不符合条件的数据，减少数据传输量，最终提升查询性能。 1. 为什么需要 WHERE 条件下推？传统的数据库查询流程，如果没有 WHERE 条件下推，通常是这样的：存储引擎：存储引擎负责读取表中的所有数据块（或数据页）。数据库服务器：将读取到的所有数据块传输到数据库服务器。数据库服务器：数据库服务器应用WHERE条件对数据进行过滤。返回结果：将过滤后的结果返回给客户端。这种方式的问题在于，即使WHERE条件可以过滤掉大部分数据，存储引擎仍然需要读取所有的数据块，并将它们传输到数据库服务器。这会导致： IO 浪费：读取了大量不必要的数据，增加了磁盘 IO 的压力。网络带宽浪费：传输了大量不必要的数据，增加了网络带宽的压力。 CPU 浪费：数据库服务器需要处理大量不必要的数据，增加了 CPU 的压力。 W …

继续阅读“`WHERE`条件的`下推`（`Predicate Pushdown`）：`存储引擎`如何`过滤`数据`以减少`传输`。”

2025年9月6日

`MySQL`的`临时表`：`内部`临时表的`创建`、`使用`和`销毁`机制。

MySQL 内部临时表：创建、使用与销毁机制详解大家好，今天我们来深入探讨 MySQL 中内部临时表的创建、使用和销毁机制。临时表是 MySQL 在执行复杂查询过程中用于存储中间结果的一种重要机制。理解它的运作方式对于优化 SQL 查询，提升数据库性能至关重要。临时表主要分为两种：用户临时表和内部临时表。用户临时表是我们通过 CREATE TEMPORARY TABLE 语句显式创建的，而内部临时表则是由 MySQL 服务器自动创建的，用于辅助查询执行。今天我们重点关注内部临时表。内部临时表的创建时机内部临时表并非总是会被创建，只有当查询需要时，MySQL 才会动态地创建它们。以下是一些常见的触发内部临时表创建的情况： ORDER BY 和 GROUP BY 子句与索引冲突: 当查询包含 ORDER BY 或 GROUP BY 子句，但优化器无法使用索引来满足排序或分组需求时，MySQL 可能会创建一个临时表来进行排序或分组。 UNION 和 UNION ALL 操作: UNION 操作需要对结果集进行去重，UNION ALL 虽然不进行去重，但在某些情况下也可能使用临时表。 …

继续阅读“`MySQL`的`临时表`：`内部`临时表的`创建`、`使用`和`销毁`机制。”

2025年9月6日

`SQL`语句的`重写`：`优化器`如何`改写`复杂的`SQL`语句以`提高`效率。

SQL 重写：优化器如何提升效率各位听众，今天我们来深入探讨 SQL 重写这个主题。SQL 重写是数据库优化器中一个至关重要的环节，它通过对复杂的 SQL 语句进行等价变换，从而生成执行效率更高的查询计划。简单来说，优化器就像一位经验丰富的代码重构师，它不会改变 SQL 语句的逻辑，但能让它跑得更快。 1. 什么是 SQL 重写？ SQL 重写，也称为查询重写或查询转换，是指数据库优化器在查询优化阶段，对用户提交的 SQL 语句进行逻辑等价变换的过程。这个过程的目标是生成语义相同但执行效率更高的 SQL 语句。重写后的 SQL 语句可以更好地利用索引、减少数据访问量、优化连接顺序等，从而提升查询性能。 2. 为什么需要 SQL 重写？简化复杂查询：用户编写的 SQL 语句可能很复杂，包含大量的子查询、连接、聚合等操作。优化器可以通过重写将这些复杂操作分解成更简单的步骤，更容易进行优化。利用索引：某些查询语句可能无法直接使用索引，通过重写可以改变查询的结构，使其能够有效地利用索引，减少全表扫描。优化连接顺序：不同表的连接顺序对查询性能有很大影响。优化器可以通过重写来选择最 …

继续阅读“`SQL`语句的`重写`：`优化器`如何`改写`复杂的`SQL`语句以`提高`效率。”

2025年9月6日

`Cardinality`（`基数`）的`估算`：`优化器`如何`估算`索引`列`的`唯一`值`数量`。

Cardinality 估算：优化器如何估算索引列的唯一值数量大家好，今天我们来深入探讨数据库优化器中的一个核心概念：Cardinality Estimation（基数估算）。准确的基数估算对于数据库查询优化至关重要，它直接影响着优化器选择最佳执行计划的能力。本文将重点讨论优化器如何估算索引列的唯一值数量，也就是Distinct Value Count (DVC)，并结合代码示例进行说明。 1. 什么是 Cardinality 以及 DVC 的重要性 Cardinality 指的是一个查询结果集中返回的行数。在数据库优化中，我们通常关注中间结果集的 Cardinality，因为它会影响后续操作的选择。而 Distinct Value Count (DVC) 是 Cardinality 的一个特例，它指的是某一列中唯一值的数量。 DVC 在优化过程中扮演着重要角色，原因如下：选择率（Selectivity）估算：选择率是指满足某个谓词条件的行数占总行数的比例。DVC 可以用来估算选择率。例如，对于 column = value 这种等值谓词，如果知道 column 列的 DVC，就 …

继续阅读“`Cardinality`（`基数`）的`估算`：`优化器`如何`估算`索引`列`的`唯一`值`数量`。”

2025年9月6日

`MySQL`的`索引`选择`算法`：`优化器`如何`评估`不同`索引`的`优劣`。

MySQL 索引选择算法：优化器如何评估不同索引的优劣大家好，今天我们来深入探讨 MySQL 数据库中索引选择算法的核心机制，即优化器如何评估不同索引的优劣，并最终选择最优索引来执行查询。这部分内容是 MySQL 性能调优的关键，理解它能帮助我们编写更高效的 SQL 语句，设计更合理的索引。索引的重要性与基本概念回顾在开始深入算法细节之前，我们先简单回顾一下索引的基本概念和作用。索引本质上是一种数据结构，它以某种排序方式存储了表中的某些列的值，并指向包含这些值的行。通过索引，MySQL 可以快速定位到满足查询条件的行，而无需扫描整个表，从而显著提高查询效率。常见的索引类型包括： B-Tree 索引： MySQL 中最常用的索引类型，适用于全值匹配、范围查询、前缀匹配等。 Hash 索引：适用于等值查询，查找速度非常快，但不支持范围查询。 Fulltext 索引：适用于全文搜索。空间索引：适用于地理空间数据查询。今天我们主要关注 B-Tree 索引，因为它是最常见和通用的索引类型。 MySQL 优化器的作用 MySQL 优化器是 SQL 查询执行的核心组件，它的主要职责 …

继续阅读“`MySQL`的`索引`选择`算法`：`优化器`如何`评估`不同`索引`的`优劣`。”

2025年9月6日

`Semi-Join`和`Anti-Join`的`优化`：`IN`、`EXISTS`和`NOT IN`子查询的`底层`改写`策略`。

Semi-Join 和 Anti-Join 的优化：IN、EXISTS 和 NOT IN 子查询的底层改写策略大家好，今天我们来深入探讨数据库查询优化中的一个重要领域：Semi-Join 和 Anti-Join 的优化，以及它们与 IN、EXISTS 和 NOT IN 子查询之间的关系，特别是数据库系统如何通过改写这些子查询来进行性能优化。 1. Semi-Join 和 Anti-Join 的概念首先，我们需要明确什么是 Semi-Join 和 Anti-Join。它们并非 SQL 标准操作符，而是数据库系统内部实现连接的一种策略，旨在更高效地处理特定类型的子查询。 Semi-Join (半连接): 简单来说，Semi-Join 的目标是判断主查询的表（外表）中，哪些行在子查询的表（内表）中存在匹配的行。它只返回外表中满足条件的行，且不会重复返回。更重要的是，Semi-Join 不需要返回来自内表的任何数据。 Anti-Join (反连接): Anti-Join 则相反，它的目标是找出主查询的表（外表）中，哪些行在子查询的表（内表）中不存在匹配的行。同样，它只返回外表中满足条件 …

继续阅读“`Semi-Join`和`Anti-Join`的`优化`：`IN`、`EXISTS`和`NOT IN`子查询的`底层`改写`策略`。”

2025年9月6日

`Join`算法`（`Nested Loop Join`、`Block Nested Loop Join`）：`不同`连接`算法`的`适用`场景与`性能`比较。

Join算法：Nested Loop Join与Block Nested Loop Join的深度剖析各位同学，大家好！今天我们来深入探讨数据库系统中至关重要的Join算法，特别是两种基础且常用的算法：Nested Loop Join (NLJ) 和 Block Nested Loop Join (BNLJ)。我们将从原理、适用场景、性能分析以及优化策略等方面进行详细讲解，并辅以代码示例，帮助大家更好地理解和应用这些算法。 1. Join操作与Join算法概述在关系型数据库中，Join操作用于将两个或多个表中的行根据它们之间的关联列组合起来，形成新的结果集。Join操作是SQL查询的核心组成部分，高效的Join算法能够显著提升查询性能。常见的Join类型包括Inner Join、Left Join、Right Join、Full Outer Join等，每种类型根据不同的条件返回不同的结果集。 Join算法则是实现Join操作的具体方法。不同的Join算法基于不同的策略来寻找匹配的行，并在性能上有显著差异。选择合适的Join算法对于优化查询性能至关重要。 2. Nested Loo …

继续阅读“`Join`算法`（`Nested Loop Join`、`Block Nested Loop Join`）：`不同`连接`算法`的`适用`场景与`性能`比较。”

2025年9月6日

`EXPLAIN`的`底层`原理：`MySQL`如何`生成`执行`计划`的`核心`算法。

好的，我们开始今天的讲座，主题是 EXPLAIN 的底层原理：MySQL 如何生成执行计划的核心算法。引言理解 MySQL 如何生成执行计划对于优化查询至关重要。EXPLAIN 语句是我们窥探 MySQL 优化器工作方式的一个窗口。但 EXPLAIN 输出的结果仅仅是表象，真正重要的是其背后的逻辑和算法。本次讲座我们将深入探讨 MySQL 优化器生成执行计划的核心步骤和算法，帮助大家理解 EXPLAIN 输出的含义，并能更有针对性地优化 SQL 查询。一、查询优化的总览 MySQL 查询优化是一个复杂的过程，可以大致分为以下几个阶段：解析 (Parsing): MySQL 首先解析 SQL 语句，验证语法是否正确，生成解析树。预处理 (Preprocessing): 预处理器会检查查询中的表和列是否存在，验证权限，并进行一些初步的转换，例如：同义词替换 (例如，将视图替换为它的定义)。子查询重写 (将某些子查询转换为连接)。优化 (Optimization): 这是最核心的阶段，优化器会生成多个可能的执行计划，并选择其中成本最低的一个。执行 (Execution): …

继续阅读“`EXPLAIN`的`底层`原理：`MySQL`如何`生成`执行`计划`的`核心`算法。”

2025年9月6日

`Planner`（`计划生成器`）：`逻辑`计划到`物理`计划的`转换`过程。

逻辑计划到物理计划的转换：Planner 剖析大家好，今天我们来深入探讨数据库查询优化器中的一个核心组件：Planner，或者更准确地说，逻辑计划到物理计划的转换过程。这是一个至关重要的步骤，直接影响数据库查询的性能。我们将从逻辑计划的概念开始，逐步深入到物理计划的生成、代价估算和最终选择，并辅以代码示例，力求让大家对这个过程有一个清晰透彻的理解。逻辑计划：查询意图的表达首先，我们需要理解什么是逻辑计划。简单来说，逻辑计划是对用户查询意图的一种抽象表示，它描述了需要执行的操作，但并没有指定具体如何执行。它关注的是“做什么”，而不是“怎么做”。逻辑计划通常以树形结构表示，节点代表逻辑操作符，例如： Scan: 从表中读取数据。 Filter: 根据条件过滤数据。 Join: 连接两个或多个表的数据。 Aggregate: 对数据进行聚合计算（例如 SUM, AVG, COUNT）。 Project: 选择需要的列。例如，对于如下 SQL 查询： SELECT o.order_id, c.customer_name FROM orders o JOIN customers c O …

继续阅读“`Planner`（`计划生成器`）：`逻辑`计划到`物理`计划的`转换`过程。”