索引 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

2025年8月28日

MySQL架构与底层原理之：`MySQL`的`自适应哈希索引`：其在查询优化中的作用与局限。

MySQL自适应哈希索引：查询优化的利器与局限大家好！今天我们来深入探讨MySQL的一个鲜为人知但功能强大的特性：自适应哈希索引（Adaptive Hash Index，AHI）。AHI是InnoDB存储引擎的一个内部优化机制，旨在加速高频查询，但理解它的工作原理和局限性对于充分利用MySQL的性能至关重要。 1. 什么是自适应哈希索引？简单来说，自适应哈希索引是InnoDB引擎根据实际查询模式自动创建的哈希索引。它不是用户手动创建的，而是InnoDB监控查询活动，当发现某些数据页经常被访问时，就会针对这些数据页的索引键值构建哈希索引，以提升查询速度。与B+树索引不同，哈希索引查找速度更快（O(1)），因为它直接通过哈希函数定位到数据页的地址。然而，哈希索引的适用范围有限，它只能用于等值查询，无法支持范围查询、排序等操作。 2. 自适应哈希索引的工作原理 InnoDB通过以下步骤来创建和维护AHI：监控查询活动： InnoDB持续监控正在执行的查询，特别是那些使用索引的查询。它会记录哪些索引键值被频繁访问。识别热点数据：当InnoDB检测到某个索引键值被频繁访问（满足一定的 …

继续阅读“MySQL架构与底层原理之：`MySQL`的`自适应哈希索引`：其在查询优化中的作用与局限。”

2025年8月17日

MySQL编程进阶之：`GROUP BY`与`ORDER BY`的索引优化：如何利用索引避免临时表和文件排序。

各位朋友，老铁们，大家好！我是你们的老朋友，今天咱们来聊聊MySQL里 GROUP BY 和 ORDER BY 这哥俩，以及怎么玩转索引让它们不再磨洋工，避免出现临时表和文件排序的尴尬局面。 (一) 开场白：啥是临时表和文件排序？为啥要避免？先来个开胃菜，了解一下临时表和文件排序到底是个啥玩意儿，为啥我们要对它们敬而远之。临时表 (Temporary Table): 你可以把它想象成一个临时的停车场。MySQL在执行一些复杂查询，特别是包含 GROUP BY 或 ORDER BY 且无法直接利用索引时，会创建一个临时的表格来存放中间结果。数据量小的时候还好，一旦数据量大了，创建和维护临时表可是个耗时耗力的活儿。文件排序 (Filesort): 这玩意儿就更惨了，相当于把数据倒在地上，然后用人肉去排序。当MySQL发现没有合适的索引可以用来排序时，它会从磁盘上读取数据，在内存中进行排序，如果内存不够，还会用到磁盘空间。这速度，慢到怀疑人生啊！为啥要避免它们呢？简单来说，就是影响性能！这哥俩出现，往往意味着你的查询很可能陷入性能瓶颈，CPU飙升，响应时间变长，用户体验直线下降。 …

继续阅读“MySQL编程进阶之：`GROUP BY`与`ORDER BY`的索引优化：如何利用索引避免临时表和文件排序。”

2025年8月17日

MySQL编程进阶之：索引设计的最佳实践：如何为`WHERE`、`ORDER BY`和`GROUP BY`子句创建索引。

各位观众老爷，晚上好！我是你们的老朋友，今天咱们来聊聊MySQL索引这玩意儿，保证让你听完之后，索引玩得比我还溜！今天的主题是：MySQL编程进阶之：索引设计的最佳实践：如何为WHERE、ORDER BY和GROUP BY子句创建索引。说白了，索引就是为了让数据库查询更快。想象一下，你在一本没有目录的超大字典里找一个词，是不是得一页一页翻？有了目录（索引），直接定位到那一页，效率瞬间提升几个数量级！一、索引的种类和基本概念（快速过一遍）在深入WHERE、ORDER BY和GROUP BY之前，咱们先简单回顾一下索引的类型，免得大家一脸懵逼。 B-Tree 索引: 这是MySQL里最常见的索引类型，也是默认类型。它可以加速数据的查找，支持范围查询，还可以在ORDER BY和GROUP BY操作中使用。 Hash 索引: Hash索引非常快，但它有一些限制。它只适用于等值查询（=, IN, <=>），不支持范围查询，也不能用于ORDER BY 和 GROUP BY。Memory存储引擎默认使用Hash索引。 Fulltext 索引: 全文索引用于在文本中搜索关键词。适 …

继续阅读“MySQL编程进阶之：索引设计的最佳实践：如何为`WHERE`、`ORDER BY`和`GROUP BY`子句创建索引。”

2025年8月17日

MySQL编程进阶之：函数式索引的设计与应用：如何为复杂的表达式创建索引。

各位观众，欢迎来到今天的“MySQL编程进阶”讲座！今天我们要聊点刺激的，聊聊MySQL世界里“函数式索引”这个听起来有点高大上，但实际上非常好用的家伙。 (一) 什么是函数式索引？别慌，没那么玄乎！简单来说，函数式索引就是基于表达式创建的索引。想象一下，你有个users表，里面有个email字段，但你经常需要忽略大小写地搜索邮件，比如查[email protected]和[email protected]都应该返回相同的结果。传统的索引只能对原始的email值进行索引，无法直接处理大小写问题。这个时候，函数式索引就派上用场了！我们可以创建一个基于LOWER(email)的索引，这样MySQL就会对email转换成小写后的值进行索引，忽略大小写差异。 (二) 为什么要用函数式索引？传统索引不好吗？传统索引当然很好，但它们有局限性。想象一下以下场景：复杂查询条件：你经常需要根据DATE(created_at)进行查询，也就是只关心created_at的日期部分，忽略时间。数据转换：你需要对JSON字段中的某个值进行索引，或者需要对字符串进行特定的格式化处 …

继续阅读“MySQL编程进阶之：函数式索引的设计与应用：如何为复杂的表达式创建索引。”

2025年8月17日

MySQL高级讲座篇之：MySQL与`AI`驱动的数据库管理系统：如何实现智能索引推荐和查询优化？

各位数据库界的靓仔靓女们，大家好！我是你们的老朋友，今天咱们来聊点高级的、时髦的——MySQL与AI驱动的数据库管理系统，重点是如何实现智能索引推荐和查询优化。说起数据库，大家肯定不陌生，增删改查嘛，谁还不会？但是，当数据量膨胀到TB甚至PB级别，查询速度慢到令人发指的时候，你就开始怀疑人生了。这时候，你就需要祭出“索引”这个神器。一、索引：数据库的“新华字典” 索引，简单来说，就是为了加速数据检索而建立的一种特殊数据结构。它就像新华字典的目录，你想查某个字，直接翻目录，找到页码，然后直奔目标，省去了从头到尾翻阅的麻烦。但是，索引也不是越多越好。索引需要占用存储空间，而且每次更新数据，都需要维护索引，这会增加数据库的负担。所以，如何选择合适的索引，就成了一门学问。二、传统索引优化：经验主义的局限在过去，索引优化主要靠DBA的经验和一些工具的辅助。DBA会根据业务场景、查询模式等信息，手动创建和调整索引。这种方式有几个明显的局限性：依赖专家经验：需要DBA具备丰富的经验和扎实的理论基础，才能做出正确的判断。耗时耗力：手动分析查询语句、评估索引效果，需要花费大量的时间和 …

继续阅读“MySQL高级讲座篇之：MySQL与`AI`驱动的数据库管理系统：如何实现智能索引推荐和查询优化？”

2025年8月17日

MySQL高级讲座篇之：MySQL 8.0的隐藏索引：如何利用它们进行性能测试和索引优化？

各位观众老爷，大家好！我是你们的老朋友，今天咱们聊点MySQL 8.0里有点意思的东西：隐藏索引 (Invisible Indexes)。这玩意儿，听起来是不是有点像武侠小说里的隐身术？别急，咱们慢慢揭开它的面纱，看看它到底能干些啥，尤其是怎么在性能测试和索引优化上帮我们一把。一、啥是隐藏索引？首先，咱们得搞清楚，啥叫隐藏索引。简单来说，隐藏索引就是一个对优化器“隐形”的索引。默认情况下，MySQL优化器在执行查询时会考虑所有可见的索引，选择它认为最优的那个来加速查询。但是，如果你把一个索引设置为隐藏，优化器就直接忽略它，就像它不存在一样。注意，这个索引仍然存在于数据库中，数据也会持续更新，只是优化器假装没看见而已。二、为啥要有隐藏索引？你可能要问了，搞这么个东西出来干啥？直接删除不就行了？这就涉及到数据库管理的艺术了。删除索引是个危险的操作，尤其是在生产环境。万一你删错了，或者删掉的索引其实很重要，那可就惨了，轻则查询变慢，重则系统崩溃。隐藏索引就提供了一种更安全的方式来评估索引的影响。你可以先隐藏一个索引，观察一段时间，看看对系统性能有没有影响。如果没有影响，或者影 …

继续阅读“MySQL高级讲座篇之：MySQL 8.0的隐藏索引：如何利用它们进行性能测试和索引优化？”

2025年8月16日

MySQL高级讲座篇之：函数式索引：如何为表达式创建索引以提升查询效率。

好的，各位观众老爷，今天咱们来聊聊MySQL里一个有点高级，但贼好用的东西：函数式索引。这玩意儿能让你的查询速度飞起，尤其是在处理一些需要对数据进行计算或者转换的场景。开场白：数据，你算计它了吗？有没有遇到过这样的情况：你想根据用户名字的首字母来查询，或者想根据订单金额的绝对值来排序？传统的索引，只能帮你找到原始数据。但是你想根据计算后的结果来查？索引就抓瞎了。举个栗子，你有个电商网站，有个字段叫 discounted_price (打折后的价格)，你要查所有打折后价格大于100的商品。你可能会这么写： SELECT * FROM products WHERE discounted_price > 100; 如果 discounted_price 上有个索引，那查询速度还行。但如果你的打折价格是根据原始价格和折扣率计算出来的，数据库里并没有 discounted_price 这个字段，而是有个 original_price 和 discount_rate，你得这样写： SELECT * FROM products WHERE original_price * (1 …

继续阅读“MySQL高级讲座篇之：函数式索引：如何为表达式创建索引以提升查询效率。”

2025年8月16日

MySQL高级讲座篇之：数据页的物理存储：行数据、索引与控制信息的布局。

各位观众老爷，大家好！我是今天的主讲人，咱们今天聊点硬核的——MySQL数据页的物理存储！这玩意儿听起来玄乎，但其实就是MySQL存数据的地方，理解了它，你就能更好地理解MySQL的性能优化，以后面试也能唬住面试官！咱们今天主要讲三个方面：行数据、索引、控制信息，看看它们在数据页里是怎么排列组合的。一、数据页的结构：一个房间里的秘密你可以把数据页想象成MySQL存放数据的房间。这个房间不是空荡荡的，里面有各种各样的东西，摆放得井井有条。这个房间的标准大小是16KB。这个“房间”主要分为以下几个部分：区域名称大小（字节）说明 File Header 38 文件头，记录页的类型、校验和等信息。 Page Header 56 页头，记录页的状态信息，比如页中记录的数量、空闲空间等。 Infimum + Supremum Records 26 两个虚拟记录，分别表示页中最小和最大的记录。 User Records 变长实际存储的行数据。 Free Space 变长空闲空间，用于存储新插入的记录。 Page Directory 变长页目录，用于加速在页中查找记录的速度，类似于 …

继续阅读“MySQL高级讲座篇之：数据页的物理存储：行数据、索引与控制信息的布局。”

2025年8月16日

MySQL高级讲座篇之：覆盖索引的魔力：如何设计索引以避免不必要的数据读取。

各位观众老爷们，大家好！今天给大家带来一场关于MySQL覆盖索引的脱口秀……啊不，技术讲座！保证让大家听得懂，学得会，还能笑出腹肌（如果你们有的话）。开场白：索引，数据库的葵花宝典话说，行走江湖，哦不，是行走在数据库的世界里，索引那就是我们的葵花宝典。练好了，速度嗖嗖的，查询如丝般顺滑；练不好，那就等着加班加点，优化代码，头发掉光光吧！第一幕：什么是覆盖索引？（别被名字吓到）别看“覆盖索引”这个名字听起来高大上，其实它就是个“懒人索引”。它懒到什么程度呢？懒到连数据表都不想回，直接从索引里把你要的数据全都掏出来！举个栗子：假设我们有一张user表，结构如下： CREATE TABLE `user` ( `id` int NOT NULL AUTO_INCREMENT, `name` varchar(255) DEFAULT NULL, `age` int DEFAULT NULL, `email` varchar(255) DEFAULT NULL, `city` varchar(255) DEFAULT NULL, PRIMARY KEY (`id`) ) ENGINE= …

继续阅读“MySQL高级讲座篇之：覆盖索引的魔力：如何设计索引以避免不必要的数据读取。”

2025年8月16日

MySQL高级讲座篇之：聚簇索引与二级索引的深度剖析：查询性能的决定性因素。

各位观众老爷，晚上好！我是今晚的MySQL特邀嘉宾，咱们今天聊点硬核的，关于MySQL的索引，但不是泛泛而谈，我们要深入到骨髓里，聊聊聚簇索引和二级索引，以及它们如何决定你的查询性能，让你的SQL跑得像闪电侠一样快！开场白：索引，性能的秘密武器话说江湖传言，SQL优化，索引先行。这可不是瞎吹，索引就像一本书的目录，没有目录，你想找个章节，那得一页一页翻，累都累死。有了索引，直接定位，效率嗖嗖的。但是，索引也不是免费的午餐，它要占用空间，更新的时候也要维护，所以，用得好，事半功倍，用不好，反受其累。第一幕：聚簇索引（Clustered Index）：数据存储的基石首先，我们来聊聊聚簇索引，这玩意儿可以说是MySQL InnoDB存储引擎的灵魂。什么是聚簇索引？简单来说，聚簇索引决定了数据在磁盘上的物理存储顺序。它不是一个单独的索引文件，而是将索引和数据放在一起存储的。你可以把它想象成一个字典，字典的正文本身就是按照拼音排序的，你查一个字的时候，找到拼音的位置，也就找到了这个字。 InnoDB的聚簇索引：主键的特权在InnoDB中，聚簇索引是基于主键创建的。如果没有显式定义 …

继续阅读“MySQL高级讲座篇之：聚簇索引与二级索引的深度剖析：查询性能的决定性因素。”