避免索引失效的常见场景与解决方案 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

好的，各位观众老爷们，大家好！我是你们的老朋友，江湖人称“索引小诸葛”的程序猿老王。今天，咱们不聊代码的海洋，也不谈算法的宇宙，而是聚焦在数据库的“高速公路”——索引上。

话说这索引啊，就好比书的目录，字典的音序表，没它，你在浩如烟海的数据里找东西，那可真叫大海捞针，累死也找不到！但是，这“高速公路”也不是万能的，一不小心，它也会“堵车”，甚至直接“封闭”，让你的查询慢如蜗牛。

今天，老王就来跟大家聊聊，这索引失效的常见场景，以及如何巧妙地避开这些“雷区”，让你的数据库查询飞起来！?

第一幕：索引的“前世今生”—— 索引是个啥？

首先，咱们得搞清楚索引是个什么玩意儿。简单来说，索引就是一种数据结构，它以某种方式（比如B树、哈希表）存储了表中的某个或某些列的值，并指向包含这些值的行的物理地址。

想象一下，你有一本《唐诗三百首》，如果你想找李白的《静夜思》，没有目录，你只能从头翻到尾，那得多费劲！有了目录，你直接翻到“李白”那一页，再找到“静夜思”，速度嗖嗖的！索引就是数据库里的“目录”，它能帮你快速定位到你想要的数据。

第二幕：索引失效的“八十一难”—— 常见场景大盘点

好了，铺垫完毕，咱们进入正题。索引失效的场景可多了，老王我总结了一下，大致有以下这些：

模糊查询，左边带“%”： “%value%” or “%value”

这可是索引失效的头号“罪犯”！想象一下，你在电话簿上找人，如果只知道名字的后半部分，你还能用电话簿的顺序查找吗？肯定不行了！数据库也一样，当你的模糊查询以“%”开头时，索引就没法利用它的有序性来快速定位了。

解决方案：
- 尽量避免使用左模糊查询。
- 如果必须使用，考虑使用全文索引（Fulltext Index），但要注意全文索引的适用场景和限制。
- 如果数据量不大，直接全表扫描也未尝不可。
举个栗子：
```
-- 索引失效
SELECT * FROM users WHERE name LIKE '%王五%';

-- 索引有效 (如果name列有索引，且'王五%'能命中部分数据)
SELECT * FROM users WHERE name LIKE '王五%';
```

OR条件： “A=1 OR B=2”

当你的查询条件包含OR时，如果OR连接的两个列没有都使用索引，那么很可能导致索引失效。

解决方案：

确保OR连接的列都有索引。
考虑使用UNION ALL来代替OR，前提是两个查询的返回列相同。
如果OR条件比较复杂，可以考虑拆分成多个简单查询。

举个栗子：

-- 假设id和name都有索引，但id索引更有效
-- OR条件，导致name索引失效, 可能导致全表扫描
SELECT * FROM users WHERE id = 1 OR name = '张三';

-- 优化：使用UNION ALL (前提是两个查询返回列相同)
SELECT * FROM users WHERE id = 1
UNION ALL
SELECT * FROM users WHERE name = '张三' AND id != 1;  --注意排除重复数据

数据类型不一致：字符串类型的列用整数查询

数据库在比较不同数据类型的值时，可能会进行隐式类型转换，这会导致索引失效。

解决方案：
- 确保查询条件中的数据类型与列的数据类型一致。
- 避免隐式类型转换。
举个栗子：
```
-- 假设id是字符串类型
-- 索引失效，因为数据库会将123转换为字符串进行比较
SELECT * FROM users WHERE id = 123;

-- 索引有效
SELECT * FROM users WHERE id = '123';
```
函数操作：对索引列使用函数

如果在WHERE子句中对索引列使用了函数（比如UPPER()、LOWER()、DATE()等），索引就无法发挥作用了。

解决方案：
- 尽量避免在WHERE子句中对索引列使用函数。
- 如果必须使用，可以考虑创建函数索引（Function-Based Index），但要注意不同数据库的支持情况。
- 将函数操作移到等号右边（如果可以）。
举个栗子：
```
-- 索引失效
SELECT * FROM users WHERE UPPER(name) = 'ZHANGSAN';

-- 索引有效 (如果可以)
SELECT * FROM users WHERE name = LOWER('ZHANGSAN');

-- 函数索引 (不同数据库语法不同，这里只是示例)
CREATE INDEX idx_upper_name ON users (UPPER(name));  -- Oracle/PostgreSQL

SELECT * FROM users WHERE UPPER(name) = 'ZHANGSAN'; -- 使用函数索引
```
计算操作：对索引列进行计算

类似于函数操作，如果在WHERE子句中对索引列进行了计算（比如id + 1 = 10），索引也会失效。

解决方案：
- 尽量避免在WHERE子句中对索引列进行计算。
- 将计算操作移到等号右边（如果可以）。
举个栗子：
```
-- 索引失效
SELECT * FROM orders WHERE order_date + INTERVAL 1 DAY = '2023-10-27';

-- 索引有效 (如果可以)
SELECT * FROM orders WHERE order_date = '2023-10-26';
```

NOT IN / != / <>：尽量避免使用

这些操作符可能会导致全表扫描，特别是当查询结果集比较大时。

解决方案：

尽量避免使用这些操作符。
如果必须使用，可以考虑使用连接查询（JOIN）或者子查询来代替。
如果数据量不大，全表扫描也未尝不可。

举个栗子：

-- 索引可能失效
SELECT * FROM products WHERE category_id NOT IN (1, 2, 3);

-- 优化：使用连接查询 (假设category表存在)
SELECT p.* FROM products p
LEFT JOIN category c ON p.category_id = c.id
WHERE c.id IS NULL OR c.id NOT IN (1,2,3); -- 更好的过滤方式可能需要根据实际情况调整

-- 更好的办法是使用 EXISTS 或者 NOT EXISTS
SELECT * FROM products WHERE NOT EXISTS (SELECT 1 FROM category WHERE category.id = products.category_id AND category.id IN (1,2,3));

联合索引，不满足最左前缀原则

如果你的索引是联合索引（Composite Index），那么在使用时必须遵循“最左前缀原则”。也就是说，查询条件必须包含联合索引的最左边的列，才能使用该索引。

解决方案：

确保查询条件包含联合索引的最左边的列。
如果无法满足最左前缀原则，可以考虑调整索引的顺序或者创建新的索引。

举个栗子：

-- 假设有联合索引 (name, age, city)
-- 索引有效
SELECT * FROM users WHERE name = '张三';
SELECT * FROM users WHERE name = '张三' AND age = 20;
SELECT * FROM users WHERE name = '张三' AND age = 20 AND city = '北京';

-- 索引部分有效 (只使用了name索引)
SELECT * FROM users WHERE name = '张三' AND city = '北京';

-- 索引失效
SELECT * FROM users WHERE age = 20;
SELECT * FROM users WHERE city = '北京';
SELECT * FROM users WHERE age = 20 AND city = '北京';

索引列参与排序，但排序方式不一致

如果在ORDER BY子句中对索引列进行排序，但排序方式（ASC/DESC）与索引的排序方式不一致，可能会导致索引失效。

解决方案：
- 确保ORDER BY子句中的排序方式与索引的排序方式一致。
- 如果无法保持一致，可以考虑创建额外的索引来支持不同的排序方式。
举个栗子：
```
-- 假设有索引 (age ASC, name DESC)
-- 索引有效
SELECT * FROM users ORDER BY age ASC, name DESC;

-- 索引失效 (部分失效，age可能有效)
SELECT * FROM users ORDER BY age ASC, name ASC;
SELECT * FROM users ORDER BY age DESC, name DESC;
```
索引选择性差：列中重复值过多

如果索引列的重复值过多，索引的选择性就很差，数据库可能会认为使用索引不如全表扫描。

解决方案：
- 避免在选择性差的列上创建索引。
- 考虑使用联合索引，将选择性好的列与选择性差的列组合在一起。
- 如果数据分布发生变化，及时重新统计索引信息。
举个栗子：

假设有一个gender列，只有两个值：’男’和’女’。在这个列上创建索引，意义不大，因为数据库查询时，几乎有一半的数据都会被命中，还不如全表扫描来得快。
优化器放弃使用索引
有些时候，即使你创建了索引，优化器也可能因为某些原因放弃使用它。例如，查询的数据量非常小，或者优化器认为全表扫描的成本更低。

解决方案：
- 使用EXPLAIN命令分析查询计划，查看是否使用了索引。
- 强制使用索引：可以使用FORCE INDEX或者USE INDEX提示来强制优化器使用指定的索引。但请谨慎使用，除非你非常清楚地知道为什么优化器会做出错误的选择。
- 检查统计信息：数据库会根据统计信息来评估查询成本。如果统计信息不准确，可能会导致优化器做出错误的选择。可以使用ANALYZE TABLE命令来更新统计信息。
- 重新评估索引策略：如果优化器经常放弃使用索引，可能需要重新评估你的索引策略，看看是否有更合适的索引可以使用。
举个栗子
```
--查看执行计划
EXPLAIN SELECT * FROM orders WHERE customer_id = 123;

--强制使用索引
SELECT * FROM orders FORCE INDEX (idx_customer_id) WHERE customer_id = 123;

--更新统计信息
ANALYZE TABLE orders;
```

第三幕： “兵来将挡，水来土掩”—— 索引优化的葵花宝典

了解了索引失效的常见场景，接下来，老王再给大家分享一些索引优化的“葵花宝典”：

不要过度索引： 索引不是越多越好。过多的索引会增加数据库的维护成本，并且在写入数据时会降低性能。只为那些经常被查询的列创建索引。
定期维护索引： 随着数据的增删改，索引可能会变得碎片化，影响查询性能。定期进行索引重建（REBUILD INDEX）或者优化（OPTIMIZE TABLE）。
监控索引使用情况： 监控哪些索引被经常使用，哪些索引很少被使用。对于很少使用的索引，可以考虑删除。
使用EXPLAIN分析查询计划： 养成使用EXPLAIN分析查询计划的习惯，了解查询是否使用了索引，以及索引的使用情况。
关注数据库版本： 不同版本的数据库在索引优化方面可能有所不同。关注数据库版本的更新和特性，可以更好地利用索引。

第四幕： “授人以鱼不如授人以渔”—— 索引设计的思想

最后，老王想跟大家分享一些索引设计的思想：

了解你的数据： 在设计索引之前，一定要充分了解你的数据，包括数据量、数据分布、查询模式等等。
选择合适的索引类型： 不同类型的索引适用于不同的场景。例如，B树索引适用于范围查询，哈希索引适用于等值查询。
平衡读写性能： 索引可以提高查询性能，但也会降低写入性能。需要在读写性能之间找到一个平衡点。
持续优化： 索引优化是一个持续的过程。随着业务的发展和数据的变化，需要不断地调整和优化索引策略。

结语：

好了，各位观众老爷们，今天的“索引防雷秘籍”就分享到这里。希望大家能够记住这些“雷区”，并灵活运用这些优化技巧，让你的数据库查询飞起来！?

记住，索引优化不是一蹴而就的事情，需要不断地学习和实践。只有真正理解了索引的原理，才能在实际工作中游刃有余，成为真正的数据库高手！ ?

如果大家觉得老王讲得还不错，不妨点个赞，加个关注，老王会继续为大家带来更多有趣实用的技术干货！咱们下期再见！ ?

发表回复 取消回复

发表回复取消回复