LIMIT 子句的性能问题与大偏移量优化方案 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

好的，各位观众，各位技术大咖，欢迎来到“数据库疑难杂症诊疗室”！我是今天的特邀主讲医师，代号“SQL神医”。今天我们要聊聊一个让无数程序员夜不能寐，头发掉光（当然，像我这种天生丽质的除外😎）的难题：LIMIT 子句的性能问题与大偏移量优化方案。

别看这 LIMIT 听起来人畜无害，就像数据库里的小透明，但它要是耍起脾气来，那可是能把你的服务器 CPU 直接干到 100%！所以，今天咱们就来扒一扒它的底裤，看看它到底在搞什么鬼。

一、LIMIT：好心办坏事？

首先，我们得搞清楚 LIMIT 子句是干嘛的。简单来说，它就是用来限制查询结果的行数的。比如，你想从 users 表里取出前 10 个用户，就可以这么写：

SELECT * FROM users LIMIT 10;

这看起来没毛病啊，效率杠杠的！但是，如果我想取出第 100001 到 100010 个用户呢？

SELECT * FROM users LIMIT 100000, 10;

这下问题就来了！你的数据库可能会开始磨磨蹭蹭，CPU 蹭蹭上涨，网页半天刷不出来，用户开始疯狂投诉……等等，这画面是不是有点熟悉？😭

为什么会这样？

原因很简单，LIMIT 子句配合偏移量（OFFSET，就是上面例子里的 100000）使用时，数据库需要做大量无用功。它必须先找到所有满足条件的前 100010 行数据，然后丢掉前 100000 行，最后才返回剩下的 10 行。

这就像什么呢？就像你要从一堆沙子里找到最后 10 颗金子，但是你必须先把所有的沙子都翻一遍！这效率能高吗？简直是沙雕！

二、LIMIT 的“罪状”：深度剖析

为了更直观地了解 LIMIT 的性能问题，我们来模拟一个场景。假设我们有一个 products 表，里面有 100 万条商品数据：

字段	类型	说明
id	INT	商品 ID
name	VARCHAR	商品名称
price	DECIMAL	商品价格
category_id	INT	分类 ID
created_at	TIMESTAMP	创建时间

我们执行以下查询：

SELECT * FROM products ORDER BY created_at DESC LIMIT 999900, 10;

这条 SQL 的意思是：按照创建时间倒序排列，取出第 999901 到 999910 这 10 条数据。

我们用 EXPLAIN 命令来分析一下这条 SQL 的执行计划：

EXPLAIN SELECT * FROM products ORDER BY created_at DESC LIMIT 999900, 10;

执行计划可能会显示类似这样的信息：

id	select_type	table	type	possible_keys	key	key_len	ref	rows	Extra
1	SIMPLE	products	ALL	NULL	NULL	NULL	NULL	1000000	Using filesort

看到 Using filesort 了吗？这说明数据库使用了文件排序，而不是索引排序。这意味着数据库需要扫描整个 products 表，然后进行排序，最后才能找到需要的数据。这简直是噩梦！🤯

罪状总结：

全表扫描： 如果没有合适的索引，数据库需要扫描整个表才能找到满足条件的数据。
文件排序： 大偏移量通常会导致数据库使用文件排序，效率极低。
大量无用功： 数据库需要找到并排序所有前面的数据，然后丢弃，造成资源浪费。

三、拯救 LIMIT：优化方案大放送

既然我们已经知道了 LIMIT 的“罪状”，接下来就要想办法拯救它了。不要慌，SQL神医这里有几剂良方，保证药到病除，让你的查询速度起飞！🚀

1. 利用索引：核心大法

索引是数据库的加速器，它可以帮助数据库快速定位到需要的数据。对于 LIMIT 查询，我们应该尽可能利用索引来避免全表扫描。

案例一：基于主键或唯一索引

如果你的查询条件是基于主键或唯一索引的，那么数据库可以非常高效地找到需要的数据。比如，如果 products 表的 id 字段是主键，我们可以这样优化：

SELECT * FROM products WHERE id > 999900 ORDER BY id LIMIT 10;

这条 SQL 的意思是：找到 id 大于 999900 的前 10 条数据。由于 id 是主键，数据库可以利用主键索引快速定位到这些数据，避免了全表扫描。

案例二：基于普通索引

如果你的查询条件是基于普通索引的，也可以利用索引来优化查询。比如，如果 products 表的 created_at 字段有索引，我们可以这样优化：

SELECT * FROM products WHERE created_at < (SELECT created_at FROM products ORDER BY created_at DESC LIMIT 999900, 1) ORDER BY created_at DESC LIMIT 10;

这条 SQL 的意思是：先找到第 999900 条数据的 created_at 值，然后找到 created_at 小于该值的前 10 条数据。由于 created_at 有索引，数据库可以利用索引快速定位到这些数据。

2. 子查询优化：曲线救国

有时候，我们无法直接利用索引来优化 LIMIT 查询，这时可以考虑使用子查询来间接优化。

案例：先查 ID，再查数据

我们可以先用子查询查出需要的数据的 ID，然后再根据 ID 查询数据。这样可以避免全表扫描和文件排序。

SELECT * FROM products WHERE id IN (SELECT id FROM products ORDER BY created_at DESC LIMIT 999900, 10) ORDER BY created_at DESC;

这条 SQL 的意思是：先用子查询查出第 999901 到 999910 条数据的 ID，然后根据 ID 查询这些数据。

3. 延迟关联：化繁为简

延迟关联是一种将查询分解成多个步骤的技术，它可以减少每次查询的数据量，从而提高查询效率。

案例：先查 ID，再关联数据

我们可以先查询出需要的数据的 ID 和排序字段，然后再将这些数据与原表进行关联，查询其他字段。

SELECT p.* FROM (SELECT id, created_at FROM products ORDER BY created_at DESC LIMIT 999900, 10) AS t JOIN products AS p ON t.id = p.id ORDER BY t.created_at DESC;

这条 SQL 的意思是：先查询出第 999901 到 999910 条数据的 ID 和 created_at 字段，然后将这些数据与 products 表进行关联，查询其他字段。

4. 书签法：步步为营

书签法是一种将查询结果缓存起来，然后每次只查询下一页数据的技术。它可以避免每次都从头开始查询，从而提高查询效率。

案例：记录上次查询的 ID

我们可以记录上次查询的最后一条数据的 ID，然后下次查询时，只查询 ID 大于该值的数据。

-- 第一次查询
SELECT * FROM products ORDER BY id LIMIT 10;

-- 记录最后一条数据的 ID
SET @last_id = (SELECT id FROM products ORDER BY id LIMIT 9, 1);

-- 第二次查询
SELECT * FROM products WHERE id > @last_id ORDER BY id LIMIT 10;

这条 SQL 的意思是：第一次查询前 10 条数据，然后记录最后一条数据的 ID。第二次查询时，只查询 ID 大于该值的前 10 条数据。

5. 禁止使用 LIMIT：终极手段

如果以上方法都无法解决你的问题，那么你可能需要重新考虑你的需求。是否真的需要查询这么大的偏移量？是否可以采用其他方式来实现相同的功能？

案例：使用游标或分页 API

你可以使用游标或分页 API 来逐步获取数据，而不是一次性查询所有数据。

四、各种方案优劣对比：表格说话

优化方案	优点	缺点	适用场景
利用索引	效率高，避免全表扫描和文件排序	需要合适的索引，如果索引不合适，效果不佳	查询条件基于索引字段，且偏移量不是特别大的情况
子查询优化	可以间接利用索引，避免全表扫描	子查询可能会影响性能，需要仔细评估	无法直接利用索引，但可以通过子查询间接利用索引的情况
延迟关联	减少每次查询的数据量，提高查询效率	需要进行表关联，可能会增加查询复杂度	需要查询大量字段，但只需要部分字段进行排序的情况
书签法	避免每次都从头开始查询，提高查询效率	需要记录上次查询的 ID，实现较为复杂	需要分页查询，且数据变化不频繁的情况
禁止使用 LIMIT	彻底解决性能问题	需要重新考虑需求，可能会影响功能实现	实在无法优化，或者有更好的替代方案的情况

五、总结：灵活应对，对症下药

LIMIT 子句的性能问题是一个复杂的难题，没有万能的解决方案。我们需要根据具体的场景和需求，灵活选择合适的优化方案。

记住，优化就像医生看病，要对症下药，不能盲目用药。只有深入了解 LIMIT 的工作原理，才能找到最有效的解决方案。

希望今天的“数据库疑难杂症诊疗”能帮助大家解决 LIMIT 的困扰。记住，SQL神医永远是你们最坚实的后盾！💪

各位，今天的讲座就到这里，感谢大家的收看！如果大家还有其他疑难杂症，欢迎随时来找我，我保证，药到病除！ 😉

发表回复 取消回复

发表回复取消回复