Redis Cluster 中 Key 的哈希槽计算规则 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

好的，各位听众，各位代码世界的探险家们，大家好！今天咱们就来聊聊 Redis Cluster 中 Key 的哈希槽计算规则，这可是 Redis 集群的心脏，掌握了它，你就能更好地理解 Redis 集群的运作方式，就像掌握了武林秘籍，打通了任督二脉一样！😎

一、Redis Cluster 简介：集群，为了更好地服务！

首先，咱们得简单回顾一下 Redis Cluster 是个啥玩意儿。想象一下，你开了一家小吃店，生意火爆，一个炉子（单机 Redis）根本忙不过来，怎么办？当然是多加几个炉子，大家一起干活嘛！这就是 Redis Cluster 的核心思想：将数据分散存储在多个 Redis 节点上，形成一个集群，从而提高整体的性能和可用性。

Redis Cluster 的特点：

数据分片： 将数据按照一定的规则分散存储在不同的节点上。
高可用： 即使部分节点宕机，集群仍然可以正常提供服务。
自动故障转移： 当主节点宕机时，从节点可以自动晋升为主节点。
可扩展性： 可以方便地增加或删除节点，扩展集群的容量。

二、哈希槽：数据的“身份证”！

现在，问题来了：这么多节点，数据该往哪个节点放呢？这就轮到哈希槽（Hash Slot）登场了。你可以把哈希槽想象成一个个房间，每个房间都有一个编号，数据（Key）通过某种算法计算出一个“身份证号”（哈希值），然后根据这个“身份证号”决定住哪个房间。

Redis Cluster 默认有 16384 个哈希槽（编号从 0 到 16383）。每个节点负责一部分哈希槽，当一个 Key 需要存储时，Redis 会根据 Key 计算出它应该属于哪个哈希槽，然后将这个 Key 存储到负责该哈希槽的节点上。

三、Key 的哈希槽计算规则：探秘“身份证”的生成！

这可是今天的重头戏！Redis Cluster 使用 CRC16 算法来计算 Key 的哈希值，然后对 16384 取模，得到 Key 对应的哈希槽。

公式如下：

slot = CRC16(key) % 16384

是不是很简单？但这里面其实藏着不少玄机，咱们一步一步来揭开它神秘的面纱。

1. CRC16 算法：计算 Key 的哈希值

CRC16 是一种循环冗余校验算法，它可以将任意长度的数据映射到一个固定长度的校验值（在 Redis Cluster 中是 16 位）。这个校验值可以作为 Key 的“指纹”，用于判断 Key 是否相同。

CRC16 算法比较复杂，咱们就不深入研究它的具体实现了，只需要知道它可以为每个 Key 生成一个唯一的哈希值就行了。你可以把它想象成一个神奇的盒子，你把 Key 放进去，它就会吐出一个数字。

2. CRC16(key)：Key 的原始哈希值

这部分就是使用 CRC16 算法计算 Key 的原始哈希值。例如，对于 Key "mykey"，CRC16("mykey") 可能会得到一个很大的数字，比如 123456789。

3. % 16384：取模运算，确定哈希槽

这部分就是将 Key 的原始哈希值对 16384 取模。取模运算就是求余数，它可以将任意大的数字映射到 0 到 16383 之间。这样，每个 Key 都会被分配到一个唯一的哈希槽。

例如，如果 CRC16("mykey") 得到的结果是 123456789，那么 123456789 % 16384 的结果可能是 1234，这意味着 Key "mykey" 应该存储在编号为 1234 的哈希槽中。

举个栗子🌰：

假设我们有三个 Key："apple", "banana", "cherry"，它们的哈希槽计算如下：

Key	CRC16(key)	CRC16(key) % 16384	Hash Slot
apple	45678	45678 % 16384 = 1234	1234
banana	98765	98765 % 16384 = 5678	5678
cherry	12345	12345 % 16384 = 12345	12345

可以看到，不同的 Key 被分配到了不同的哈希槽。

四、Hash Tag：控制 Key 的哈希槽

有时候，我们希望将一些相关的 Key 存储在同一个节点上，以便进行一些原子操作。例如，我们可能希望将同一个用户的订单信息存储在同一个节点上，这样就可以方便地查询用户的订单列表。

为了实现这个目标，Redis Cluster 提供了 Hash Tag 功能。Hash Tag 允许你在 Key 中使用 {} 包裹一部分字符串，Redis 会只对 {} 中的字符串进行哈希计算，从而保证所有包含相同 Hash Tag 的 Key 都被分配到同一个哈希槽。

语法：

{tag}key

举个栗子🌰：

假设我们有以下几个 Key：

user:{1000}:name
user:{1000}:age
user:{1000}:email
user:{2000}:name

这些 Key 都包含 user:{} 这样的模式，其中 {} 中的数字表示用户 ID。如果我们使用 Hash Tag，将 {1000} 作为 Hash Tag，那么 Redis 会只对 1000 进行哈希计算，从而保证 user:{1000}:name、user:{1000}:age 和 user:{1000}:email 这三个 Key 都被分配到同一个哈希槽。而 user:{2000}:name 则会被分配到另一个哈希槽。

Hash Tag 的优点：

保证相关数据存储在同一个节点： 方便进行原子操作。
提高查询效率： 减少跨节点查询的次数。

Hash Tag 的注意事项：

只对 {} 中的字符串进行哈希计算： {} 中的字符串必须是连续的，不能包含空格或其他特殊字符。
{} 必须存在： 如果 Key 中没有 {}，则会使用整个 Key 进行哈希计算。
选择合适的 Hash Tag： 选择能够代表一组相关数据的字符串作为 Hash Tag。

五、哈希槽与节点的关系：谁来负责？

每个 Redis Cluster 节点负责一部分哈希槽。这个分配关系是在集群初始化时确定的，并且可以动态调整。

你可以使用 CLUSTER SLOTS 命令来查看每个节点负责的哈希槽范围。

例如，执行 CLUSTER SLOTS 命令可能会得到类似以下的输出：

1) 1) (integer) 0
   2) (integer) 5460
   3) 1) "192.168.1.100"
      2) (integer) 7000
      3) "master"
   4) 1) "192.168.1.101"
      2) (integer) 7003
      3) "slave"
2) 1) (integer) 5461
   2) (integer) 10922
   3) 1) "192.168.1.102"
      2) (integer) 7001
      3) "master"
   4) 1) "192.168.1.103"
      2) (integer) 7004
      3) "slave"
3) 1) (integer) 10923
   2) (integer) 16383
   3) 1) "192.168.1.104"
      2) (integer) 7002
      3) "master"
   4) 1) "192.168.1.105"
      2) (integer) 7005
      3) "slave"

这个输出表示：

节点 192.168.1.100:7000 负责哈希槽 0 到 5460。
节点 192.168.1.102:7001 负责哈希槽 5461 到 10922。
节点 192.168.1.104:7002 负责哈希槽 10923 到 16383。

六、集群重分片：动态调整哈希槽分配

当集群需要扩容或缩容时，需要调整哈希槽的分配。这个过程称为重分片（Resharding）。

重分片的过程比较复杂，涉及到数据的迁移。Redis Cluster 提供了一套工具来帮助你完成重分片操作。

七、总结：掌握哈希槽，玩转 Redis Cluster！

今天咱们一起深入探讨了 Redis Cluster 中 Key 的哈希槽计算规则，希望大家对以下几个关键点有更清晰的认识：

Redis Cluster 使用哈希槽来实现数据分片。
Key 的哈希槽通过 CRC16 算法计算，并对 16384 取模得到。
Hash Tag 可以控制 Key 的哈希槽，保证相关数据存储在同一个节点。
每个节点负责一部分哈希槽，这个分配关系可以动态调整。

掌握了哈希槽的计算规则，你就能更好地理解 Redis Cluster 的运作方式，从而更好地利用它来构建高性能、高可用的应用。

八、灵魂拷问环节：

为什么要使用 16384 个哈希槽？这个数字有什么特殊意义吗？(其实跟节点数量有关，节点数量越多，迁移时间越长，16384是一个相对平衡的值)
如果 Key 中包含多个 {}，Redis 会如何处理？(只认第一个)
在实际应用中，如何选择合适的 Hash Tag？(根据业务场景选择，确保相关数据尽可能均匀地分布在不同的节点上)

希望今天的分享对大家有所帮助！如果大家还有什么疑问，欢迎随时提问。咱们下次再见！👋

发表回复 取消回复

发表回复取消回复