admin - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

2025年8月20日

MySQL高阶讲座之：`MySQL`的`Deadlock`：其`LIFO`死锁检测算法与`trx_sys`链表。

各位观众老爷们，早上好！今天咱们来聊聊MySQL里让人头疼，但又不得不面对的——死锁（Deadlock）。别怕，今天咱们用大白话，加上一些“骚操作”的代码，把这个“拦路虎”给安排明白了。开场白：死锁是个啥玩意儿？想象一下，两个吃货同时抢最后一块红烧肉，一个拿着筷子夹着不放，另一个拿着勺子挖着不松手，谁也不让谁，结果就是红烧肉在那里纹丝不动，俩人都吃不上。这就是死锁的“吃货版”解释。在MySQL里，死锁就是两个或多个事务，互相持有对方需要的资源，都在等待对方释放资源，导致谁也无法继续执行下去，最终大家都卡住了。正餐：LIFO死锁检测算法与trx_sys链表 MySQL为了解决死锁问题，搞了一套叫做“死锁检测”的机制。简单来说，就是MySQL会定期检查有没有事务陷入了互相等待的僵局，如果有，就“枪毙”其中一个事务，让其他事务得以继续执行。死锁检测算法的核心，就是如何高效地找到这些“互相等待”的事务。MySQL用的是一种叫做“LIFO（Last In, First Out）”的策略，结合一个叫做trx_sys的链表来实现。 trx_sys链表：事务江湖的“花名册” trx_sys你 …

继续阅读“MySQL高阶讲座之：`MySQL`的`Deadlock`：其`LIFO`死锁检测算法与`trx_sys`链表。”

2025年8月20日

MySQL高阶讲座之：`MySQL`的`Wait Events`：如何通过`Performance Schema`分析瓶颈。

各位观众老爷，大家好！我是你们的老朋友，今天咱们聊点MySQL里稍微深奥但又非常实用的话题：Wait Events，以及如何用Performance Schema这把瑞士军刀来分析性能瓶颈。准备好了吗？系好安全带，我们要开车了！开篇：什么是Wait Events？为什么要关心它？想象一下，你在一家餐厅等餐，这“等待”就是一种Wait Event。在MySQL的世界里，线程执行SQL语句的时候，也经常需要等待，比如等待磁盘I/O、等待锁、等待网络数据等等。这些等待，就是Wait Events。为什么我们要关心Wait Events？因为性能瓶颈往往就藏在这些等待里！如果你的MySQL服务器CPU利用率不高，但响应速度却很慢，那很有可能就是线程在等待某些资源。找到这些等待，就能精准定位性能瓶颈，对症下药。 Performance Schema：你的MySQL侦察兵 Performance Schema是MySQL自带的性能监控工具，它就像一位默默无闻的侦察兵，记录着MySQL服务器内部各种事件的发生情况，包括Wait Events。开启Performance Schema后， …

继续阅读“MySQL高阶讲座之：`MySQL`的`Wait Events`：如何通过`Performance Schema`分析瓶颈。”

2025年8月20日

MySQL高阶讲座之：`MySQL`的`Temp Table`：`Disk Temp Table`与`Memory Temp Table`的性能分析。

各位观众老爷，掌声欢迎来到今天的MySQL高阶讲座！今天咱不搞虚的，直奔主题——MySQL的临时表（Temp Table）。这玩意儿，用得好，性能蹭蹭往上涨；用不好，慢得让你怀疑人生。今天咱们就来扒一扒Disk Temp Table（磁盘临时表）和Memory Temp Table（内存临时表），看看它们到底有啥区别，以及在什么情况下该选谁。开场白：临时表是个啥？临时表，顾名思义，就是MySQL在执行查询过程中临时创建的表。它只在当前会话有效，会话结束后自动消失，就像灰姑娘的魔法一样。那MySQL为啥要搞这么个东西出来呢？主要原因是为了优化查询。某些复杂的查询，比如涉及大量的JOIN、GROUP BY、ORDER BY等操作，直接在原表上操作效率很低。这时候，MySQL会把中间结果放到临时表里，然后再对临时表进行操作，从而提高整体性能。临时表的两种类型：Disk vs. Memory MySQL的临时表有两种类型： Memory Temp Table (内存临时表): 存储在内存中，速度快，但受限于tmp_table_size和max_heap_table_size这两个参数的 …

继续阅读“MySQL高阶讲座之：`MySQL`的`Temp Table`：`Disk Temp Table`与`Memory Temp Table`的性能分析。”

2025年8月20日

MySQL高阶讲座之：`MySQL`的`Correlated Subquery`：其性能陷阱与`JOIN`重写。

OK，各位亲爱的码农朋友们，大家好！今天咱们来聊聊MySQL里一个让人又爱又恨的小妖精——关联子查询（Correlated Subquery）。说它小妖精，是因为它看起来挺简单，用起来也挺方便，但是一不小心，就会让你掉进性能的大坑里。咱们今天就来扒一扒它的底裤，看看它到底有什么能耐，又有什么弱点，以及，怎么才能驯服它，让它乖乖地为我们服务。第一幕：关联子查询是个啥？简单来说，关联子查询就是指在子查询中引用了外部查询的列。这就像是两个人聊天，一个人说：“我喜欢那个…（停顿）… 你昨天说的那个！” “你昨天说的那个” 就是引用了外部的信息，必须结合上下文才能知道具体指什么。举个栗子：假设我们有两个表：Customers（客户表）和 Orders（订单表）。 Customers 表结构： Column Name Data Type customer_id INT name VARCHAR city VARCHAR Orders 表结构： Column Name Data Type order_id INT customer_id INT order_date DATE amount …

继续阅读“MySQL高阶讲座之：`MySQL`的`Correlated Subquery`：其性能陷阱与`JOIN`重写。”

2025年8月20日

MySQL高阶讲座之：`MySQL`的`Histogram`直方图：其在`Cardinality`估算中的作用。

各位观众老爷们，晚上好！今天咱们聊点MySQL内部的“黑魔法”——直方图 (Histogram)。别怕，听起来高大上，其实就是个更精准的“数字饼图”，能让MySQL在优化查询时更聪明。一、开场白：Cardinality估算的重要性在深入直方图之前，咱们先得明白一个概念：Cardinality（基数）。简单来说，就是某列有多少个不同的值。比如，一个gender列，通常只有“男”和“女”两种，那它的Cardinality就是2。而一个user_id列，每个用户都有唯一的ID，那它的Cardinality就接近于表里的总行数。为啥Cardinality重要？因为它直接影响MySQL的查询优化。MySQL的优化器会根据Cardinality来判断走哪个索引效率更高，甚至决定是否全表扫描。如果Cardinality估算不准，优化器就可能“脑抽”，选一个效率很低的执行计划，导致查询慢如蜗牛。举个例子，假设我们有个users表，有个city列，建了索引。现在要查居住在“北京”的用户： SELECT * FROM users WHERE city = ‘北京’; 如果MySQL估算city = …

继续阅读“MySQL高阶讲座之：`MySQL`的`Histogram`直方图：其在`Cardinality`估算中的作用。”

2025年8月20日

MySQL高阶讲座之：`MySQL`的`Cost Model`：如何调整参数以影响`Query Optimizer`的决策。

各位观众老爷，大家好！今天咱来聊聊MySQL的“Cost Model”，也就是成本模型。这玩意儿听起来高大上，其实说白了就是MySQL的Query Optimizer（查询优化器）用来判断哪个执行计划更“划算”的工具。你想啊，同样一条SQL语句，可能有十几种、甚至几十种不同的执行方式，到底选哪个？就得靠这个Cost Model来算算账，看看哪个花的钱最少（时间、资源）。别害怕，咱们不搞数学公式推导，就用大白话聊聊它背后的逻辑，以及怎么通过调整参数来“忽悠”它，让它按照你的想法来优化查询。一、啥是Cost？简单来说，Cost就是MySQL认为执行一个操作需要消耗的“成本”。这个成本不是指人民币，而是抽象的，代表了时间、CPU、IO等等资源的消耗。Cost越低，MySQL就认为这个执行计划越好。 Cost Model考虑的因素很多，包括： Rows: 扫描的行数，扫描的行越多，成本越高。 IO: 读写磁盘的次数，磁盘IO是性能瓶颈之一，IO次数越多，成本越高。 CPU: CPU的消耗，CPU计算越多，成本越高。内存: 内存的使用情况，内存消耗越大，成本越高。 MySQL会将这些因素 …

继续阅读“MySQL高阶讲座之：`MySQL`的`Cost Model`：如何调整参数以影响`Query Optimizer`的决策。”

2025年8月20日

MySQL高阶讲座之：`MySQL`的`Fulltext Search`：其索引实现与`TF-IDF`算法。

各位好，我是你们今天的MySQL Fulltext Search专题讲座主持人。今天咱们不讲“Hello, World!”，直接来点硬核的——聊聊MySQL的全文本搜索，特别是它的索引实现和TF-IDF算法。保证让你听完之后，感觉自己也能手撸一个搜索引擎似的！一、Fulltext Search：告别Like的慢生活你肯定用过LIKE ‘%keyword%’来做模糊查询吧？慢吧？特别慢吧？数据量一大，简直是灾难现场。 LIKE是全表扫描，效率低到尘埃里。 Fulltext Search就是来拯救世界的。它可以建立全文索引，然后通过索引来快速定位包含关键词的文档。二、Fulltext Index：索引的秘密花园 Fulltext Index就像一个倒排索引（Inverted Index）。倒排索引是啥？别怕，其实很简单。假设我们有三句话： Document 1: "The quick brown fox" Document 2: "The quick gray fox" Document 3: "Fox jumped ove …

继续阅读“MySQL高阶讲座之：`MySQL`的`Fulltext Search`：其索引实现与`TF-IDF`算法。”

2025年8月20日

MySQL高阶讲座之：`MySQL`的`Subquery`优化：`Materialize`、`Semi-join`和`IN-subquery`的重写。

各位观众老爷，晚上好！我是你们的老朋友，今天咱们聊聊MySQL子查询优化这档子事儿。别看这玩意儿名字高大上，其实就是让MySQL跑得更快更顺溜的小技巧。今天咱主要讲讲Materialize、Semi-join和IN-subquery的重写，保证让你听得懂、学得会，用得上。开场白：子查询这玩意儿，是蜜糖还是砒霜？子查询，顾名思义，就是嵌套在其他SQL语句中的查询。这玩意儿写起来方便，逻辑也清晰，但用不好那就是性能杀手。想象一下，你点了个外卖，结果骑手先跑到隔壁市买食材再给你送，这速度能快吗？子查询也是一样，如果MySQL执行子查询的方式不对，那效率简直惨不忍睹。好在，MySQL也不是吃素的，它会尝试优化你的子查询，让它跑得飞快。今天咱们就来扒一扒MySQL优化子查询的三大绝招：Materialize、Semi-join和IN-subquery的重写。第一章：Materialize：化繁为简，空间换时间 Materialize，中文可以理解为“物化”，就是把子查询的结果集先存到一个临时表里，然后再跟外面的查询进行关联。这就像先把外卖食材买好，再开始做菜，是不是效率就高多了？啥时候 …

继续阅读“MySQL高阶讲座之：`MySQL`的`Subquery`优化：`Materialize`、`Semi-join`和`IN-subquery`的重写。”

2025年8月20日

MySQL高阶讲座之：`MySQL`的`In-Memory`计算：`Memory`引擎与`InnoDB`缓冲池的性能对比。

各位观众老爷们，晚上好！我是老码农，今天给大家带来一场关于MySQL内存计算的“烧脑盛宴”——MySQL的In-Memory计算：Memory引擎与InnoDB缓冲池的性能对比。准备好了吗？咱们这就开始！开场白：聊聊“内存”这回事话说，在计算机世界里，速度就是生命。而内存，就像是CPU的超级跑车道，数据在里面跑得飞快。MySQL当然也深谙此道，搞出了各种内存相关的技术，目的只有一个：榨干每一滴性能！今天，我们就聚焦两种主要的内存计算方式： Memory引擎（原名HEAP）：一个纯粹的内存数据库引擎，数据全部加载到内存中。 InnoDB缓冲池（Buffer Pool）：InnoDB存储引擎的核心组件，用于缓存磁盘上的数据和索引。这俩兄弟，虽然都住在内存里，但性格和用途却大相径庭。接下来，我们就好好扒一扒它们的底裤，看看谁才是真正的“内存之王”。第一回合：引擎介绍及创建 Memory引擎：速度与激情的化身 Memory引擎最大的特点就是快！因为它把所有数据都放在内存里，读写速度几乎可以达到极限。但是，它也有一个致命的弱点：一旦MySQL服务器重启，或者发生崩溃，数据就全部丢失了 …

继续阅读“MySQL高阶讲座之：`MySQL`的`In-Memory`计算：`Memory`引擎与`InnoDB`缓冲池的性能对比。”

2025年8月20日

MySQL高阶讲座之：`MySQL`的`Explain Analyze`：如何通过其输出分析实际执行计划。

嘿，各位数据库探险家们！准备好深入MySQL的内核，揭秘查询的真实运行轨迹了吗？今天咱们就来聊聊一个超级给力的工具：EXPLAIN ANALYZE。别被这名字吓到，它其实就是EXPLAIN的升级版，不仅告诉你MySQL 计划怎么执行查询，还告诉你它实际是怎么执行的！这就像是你有了一个内置的侦探，可以追踪查询的每一步，揪出性能瓶颈。一、为什么需要EXPLAIN ANALYZE？首先，让我们快速回顾一下EXPLAIN。它能告诉你： MySQL优化器打算如何执行你的查询。使用了哪些表，以什么顺序访问它们。使用了哪些索引（如果用了的话）。大致的扫描行数。但问题来了，EXPLAIN仅仅是计划，而不是现实。数据倾斜：某些值可能比预期的更常见，导致优化器估计的行数不准确。数据变化：在你分析查询计划和实际执行查询之间，数据可能发生了变化。优化器的“小聪明”：优化器可能会根据运行时统计信息做出一些你意想不到的调整。这些因素都会导致EXPLAIN的结果与实际情况不符。这就是EXPLAIN ANALYZE大显身手的地方！它能提供真实的执行信息，包括每个步骤花费的时间 …

继续阅读“MySQL高阶讲座之：`MySQL`的`Explain Analyze`：如何通过其输出分析实际执行计划。”