避免使用 `KEYS` 命令的根本原因与替代方案 `SCAN` - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

避免 `KEYS` 命令的深渊：踏上 `SCAN` 的光明之旅

各位技术栈上的旅行者们，大家好！我是你们的老朋友，一位在代码海洋里摸爬滚打了多年的老水手。今天，我们要聊一个关于 Redis 的话题，一个看似简单却暗藏玄机，稍不留神就会让你翻船的话题：KEYS 命令。

你可能会想：“KEYS 命令？不就是查一下 Redis 里面有哪些 key 嘛，有什么大不了的？”

如果你这么想，那就图样图森破了！KEYS 命令就像一个潜伏在平静水面下的冰山，当你一头撞上去的时候，可能就是系统崩溃、服务雪崩的开始。?

为什么 KEYS 命令会让你哭泣？

想象一下，你是一位图书馆管理员，图书馆里藏书浩如烟海。现在有人让你把所有书的书名都抄下来。你会怎么做？

KEYS 命令模式： 你拿起笔，从第一个书架开始，一排一排地抄写，直到把所有书架都抄完。
SCAN 命令模式： 你拿到一个清单，清单上列出了每个书架的编号。你从清单上选一个书架，抄写这个书架上的书名，然后休息一下。接着，再从清单上选一个书架，继续抄写。

显然，第一种方式会让你累到崩溃，而且在抄写过程中，图书馆的其他人就没法借书了！Redis 的 KEYS 命令就是这样的第一种方式。

KEYS 命令会扫描整个 Redis 实例的 key 空间，找到所有符合给定模式的 key。这意味着：

阻塞主线程： 在扫描期间，Redis 的主线程会被完全阻塞，无法处理其他请求。
性能灾难： 对于大型 Redis 实例，扫描过程可能需要很长时间，导致服务响应缓慢甚至完全不可用。
雪崩效应： 如果你的服务依赖 Redis，而 Redis 又因为 KEYS 命令被阻塞，那么你的服务也可能会跟着崩溃，进而引发整个系统的雪崩效应。

所以，KEYS 命令就像潘多拉的魔盒，一旦打开，带来的可能是无尽的痛苦和灾难。?

SCAN 命令：救赎之路

幸运的是，Redis 提供了另一种选择：SCAN 命令。SCAN 命令就像我们上面说的第二种抄书方式，它采用游标的方式进行迭代式扫描，每次只扫描一部分 key，不会阻塞主线程。

SCAN 命令的运作方式如下：

初始化： 第一次调用 SCAN 命令时，游标值为 0。
迭代： 每次调用 SCAN 命令，Redis 会返回一个新的游标值和一个匹配的 key 列表。
结束： 当返回的游标值为 0 时，表示扫描完成。

SCAN 命令的基本语法如下：

SCAN cursor [MATCH pattern] [COUNT count]

cursor: 上一次迭代返回的游标值。第一次迭代时为 0。
MATCH pattern: 可选参数，用于指定匹配的 key 的模式。类似于 KEYS 命令中的模式。
COUNT count: 可选参数，用于指定每次迭代返回 key 的数量的近似值。默认值为 10。

SCAN 命令的优势：

非阻塞： SCAN 命令不会阻塞主线程，可以保证 Redis 服务的可用性。
渐进式扫描： SCAN 命令每次只扫描一部分 key，可以避免一次性扫描整个 key 空间带来的性能问题。
可控制性： 你可以通过 COUNT 参数控制每次迭代返回 key 的数量，从而平衡扫描速度和资源消耗。

SCAN 命令的示例：

假设我们的 Redis 数据库中存在以下 key：

user:1
user:2
user:3
product:1
product:2
order:1
order:2

我们想要扫描所有以 "user:" 开头的 key。我们可以使用以下命令：

SCAN 0 MATCH user:* COUNT 10

第一次调用会返回：

1) "17"
2) 1) "user:1"
   2) "user:2"
   3) "user:3"

这表示：

新的游标值为 "17"。
匹配的 key 列表为 ["user:1", "user:2", "user:3"]。

接下来，我们使用新的游标值继续扫描：

SCAN 17 MATCH user:* COUNT 10

第二次调用会返回：

1) "0"
2) (empty list or set)

这表示：

新的游标值为 "0"，表示扫描完成。
没有找到更多的匹配 key。

SSCAN, HSCAN, ZSCAN 命令：针对不同数据结构的扫描

Redis 还提供了针对不同数据结构的扫描命令：

SSCAN: 用于扫描集合 (Set) 中的元素。
HSCAN: 用于扫描哈希 (Hash) 中的字段和值。
ZSCAN: 用于扫描有序集合 (Sorted Set) 中的元素和分数。

这些命令的用法与 SCAN 命令类似，只是针对的数据结构不同。

代码示例（Python）：

以下是一个使用 Python 和 Redis 客户端 redis-py 实现 SCAN 命令的示例：

import redis

# 连接 Redis
r = redis.Redis(host='localhost', port=6379, db=0)

def scan_keys(pattern, count=10):
    cursor = 0
    keys = []
    while True:
        cursor, data = r.scan(cursor=cursor, match=pattern, count=count)
        keys.extend(data)
        if cursor == 0:
            break
    return keys

# 扫描所有以 "user:" 开头的 key
user_keys = scan_keys(pattern='user:*')
print(user_keys)

# 扫描所有 key
all_keys = scan_keys(pattern='*')
print(all_keys)

KEYS 命令的禁区：何时绝对不能使用？

以下是一些绝对不能使用 KEYS 命令的场景：

生产环境： 在生产环境中，Redis 实例通常存储大量数据，使用 KEYS 命令会导致严重的性能问题。
高并发场景： 在高并发场景下，Redis 实例需要处理大量的请求，使用 KEYS 命令会阻塞主线程，导致服务响应缓慢甚至崩溃。
数据量大的实例： 对于数据量很大的 Redis 实例，扫描整个 key 空间可能需要很长时间，使用 KEYS 命令是不可接受的。

KEYS 命令的例外：是否存在可以使用的情况？

虽然我们强烈建议避免使用 KEYS 命令，但在一些特殊情况下，它可能仍然有用：

开发环境： 在开发环境中，Redis 实例的数据量通常较小，可以使用 KEYS 命令进行简单的调试和测试。
低峰期： 在 Redis 服务的低峰期，可以使用 KEYS 命令进行一些简单的管理操作，但需要谨慎使用，并监控 Redis 的性能指标。
特定场景： 在某些特定场景下，例如需要一次性获取所有 key 的数量，可以使用 KEYS 命令，但需要确保 Redis 实例的负载较低。

总而言之，尽量避免使用 KEYS 命令，使用 SCAN 命令作为替代方案。

更优雅的解决方案：数据结构设计与索引

除了使用 SCAN 命令，更优雅的解决方案是优化数据结构设计和使用索引。

例如，如果需要根据某些条件查询 key，可以考虑使用 Redis 的 Sorted Set 或 Hash 数据结构，并根据查询条件建立索引。

Sorted Set: 可以根据分数 (score) 对元素进行排序，并支持范围查询。
Hash: 可以存储键值对，并可以根据键 (field) 进行查询。

通过合理的数据结构设计和索引，可以避免使用 SCAN 命令进行全表扫描，从而提高查询效率。

表格总结：KEYS vs SCAN

特性	`KEYS`	`SCAN`
阻塞性	阻塞主线程	非阻塞
性能	性能差，尤其是在数据量大的情况下	性能好，渐进式扫描
适用场景	开发环境、低峰期、数据量小的实例	生产环境、高并发场景、数据量大的实例
数据结构	扫描整个 key 空间	扫描整个 key 空间，但以游标方式迭代
复杂性	简单易用	稍微复杂，需要处理游标

结论：告别 KEYS，拥抱 SCAN 的未来

各位技术栈上的旅行者们，希望通过今天的讲解，你们能够深刻理解 KEYS 命令的潜在风险，并掌握 SCAN 命令的使用方法。

记住，KEYS 命令是过去式，SCAN 命令才是未来！ ?

让我们一起告别 KEYS 命令的深渊，踏上 SCAN 的光明之旅，构建更稳定、更高效的 Redis 应用！

最后，我想说的是，技术之路永无止境，我们需要不断学习、不断探索，才能在这个快速变化的时代立于不败之地。

感谢大家的聆听，我们下次再见！ ?

避免 KEYS 命令的深渊：踏上 SCAN 的光明之旅

发表回复 取消回复

避免 `KEYS` 命令的深渊：踏上 `SCAN` 的光明之旅

发表回复取消回复