Redis `Sorted Set` 排行榜：实时更新与区间查询优化 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

各位技术同仁，大家好！今天我们要聊聊 Redis Sorted Set 在排行榜应用中的骚操作，保证让你听完之后，下次再碰到排行榜需求，嘴角能不自觉地微微上扬。

一、排行榜：一个老生常谈的问题，但依旧很性感

排行榜，这玩意儿听起来好像很古老，但实际上在各种 App、游戏、活动中都扮演着重要角色。你想想，哪个游戏没有个战力榜？哪个 App 没有个活跃用户榜？哪个活动没有个积分榜？

排行榜的核心需求其实很简单：

实时更新： 用户行为发生变化，排名要立刻刷新。
区间查询： 快速获取指定范围内的排名数据（比如 Top 10、我的排名附近的人）。

看似简单，但如果数据量一大，传统的数据库方案（比如 MySQL）就容易捉襟见肘，性能瓶颈分分钟教你做人。而 Redis Sorted Set，作为排行榜的黄金搭档，凭借其独特的魅力，能优雅地解决这些问题。

二、Redis Sorted Set：排行榜的瑞士军刀

Sorted Set，顾名思义，是一个有序的集合。它的特点是：

每个元素都有一个分数（score）： 这个分数决定了元素在集合中的排序位置。
元素是唯一的： 集合中的元素不能重复。
有序性： 元素按照分数从小到大排列（默认情况下）。

Sorted Set 的数据结构底层是跳跃表（skiplist）和哈希表的结合。跳跃表保证了查找的效率，哈希表保证了元素的唯一性。

三、Sorted Set 实现排行榜：简单粗暴但有效

使用 Sorted Set 实现排行榜非常简单。我们可以把用户 ID 作为元素，把用户的分数（比如积分、战力等）作为 score。

1. 添加/更新用户分数：ZADD

ZADD leaderboard 1000 user1  # 添加 user1，分数为 1000
ZADD leaderboard 1200 user2  # 添加 user2，分数为 1200
ZADD leaderboard 1100 user3  # 添加 user3，分数为 1100
ZADD leaderboard 1300 user1  # 更新 user1 的分数为 1300

这里的 leaderboard 是 Sorted Set 的 key，1000、1200、1100、1300 是分数，user1、user2、user3 是元素。ZADD 命令会根据分数自动调整元素在集合中的位置。如果元素已经存在，则更新其分数。

2. 获取 Top N：ZREVRANGE

ZREVRANGE leaderboard 0 9 WITHSCORES  # 获取分数最高的 10 个用户（包含分数）

ZREVRANGE 命令可以按照分数从高到低（逆序）获取指定范围内的元素。0 9 表示获取前 10 个元素（索引从 0 开始）。WITHSCORES 可选，表示同时返回元素的分数。

3. 获取用户排名：ZREVRANK

ZREVRANK leaderboard user1  # 获取 user1 的排名（从 0 开始）

ZREVRANK 命令可以获取指定元素在集合中的排名（从 0 开始，分数最高的排名为 0）。

4. 获取用户分数：ZSCORE

ZSCORE leaderboard user1  # 获取 user1 的分数

ZSCORE 命令可以获取指定元素的分数。

5. 获取指定排名范围的用户：ZREVRANGE

ZREVRANGE leaderboard 10 19 WITHSCORES # 获取排名第 11 到 20 的用户

简单示例代码 (Python + redis-py):

import redis

# 连接 Redis
r = redis.Redis(host='localhost', port=6379, db=0)

# 添加/更新用户分数
r.zadd('leaderboard', {'user1': 1000, 'user2': 1200, 'user3': 1100})
r.zadd('leaderboard', {'user1': 1300}) # 更新 user1 的分数

# 获取 Top 5
top_5 = r.zrevrange('leaderboard', 0, 4, withscores=True)
print("Top 5:", top_5)

# 获取 user1 的排名
rank = r.zrevrank('leaderboard', 'user1')
print("user1 的排名:", rank)

# 获取 user1 的分数
score = r.zscore('leaderboard', 'user1')
print("user1 的分数:", score)

# 获取排名 5-10 的用户
range_users = r.zrevrange('leaderboard', 4, 9, withscores=True)
print("排名 5-10 的用户:", range_users)

四、性能优化：让排行榜飞起来

虽然 Sorted Set 本身性能已经很不错，但在高并发、大数据量的场景下，我们仍然需要进行一些优化，让排行榜飞起来。

1. 合理设置 Key：避免 Big Key

如果所有排行榜数据都放在同一个 Sorted Set 中，当数据量非常大时，这个 Key 就变成了 Big Key，会影响 Redis 的性能。解决方法是将排行榜数据分散到多个 Sorted Set 中。

按时间分片： 例如，每天一个排行榜，leaderboard:2023-10-27、leaderboard:2023-10-28。
按业务分片： 例如，不同游戏的排行榜，game1:leaderboard、game2:leaderboard。

2. 使用 Pipeline：批量操作

Redis 的 Pipeline 可以将多个命令打包发送到 Redis 服务器，减少网络开销。在批量更新用户分数时，使用 Pipeline 可以显著提高性能。

import redis

r = redis.Redis(host='localhost', port=6379, db=0)

# 使用 Pipeline 批量更新用户分数
pipe = r.pipeline()
pipe.zadd('leaderboard', {'user4': 1400})
pipe.zadd('leaderboard', {'user5': 1500})
pipe.execute()

3. 缓存：减少 Redis 压力

对于一些实时性要求不高的排行榜数据，可以将其缓存在内存中（比如使用 Python 的字典），定期从 Redis 更新。这样可以减少 Redis 的读取压力。

4. 限制排行榜大小：ZREMRANGEBYRANK

为了避免排行榜数据无限增长，我们可以定期清理排名靠后的数据。ZREMRANGEBYRANK 命令可以删除指定排名范围内的元素。

ZREMRANGEBYRANK leaderboard 100 -1  # 删除排名 101 名之后的所有用户

100 -1 表示删除排名从 101 到最后一名的所有元素。

5. 避免过度计算：利用已有数据

在某些场景下，我们可以利用已有的数据来减少计算量。例如，如果只需要知道用户是否进入 Top 100，而不需要知道具体的排名，可以使用 ZSCORE 命令获取用户分数，然后与 Top 100 的最低分数进行比较。

6. 精确控制过期时间:

如果排行榜是临时的(比如活动排行榜)，务必设置合理的过期时间。使用 EXPIRE 命令设置过期时间：

EXPIRE leaderboard 3600  # 设置 leaderboard 的过期时间为 3600 秒（1 小时）

7. 考虑使用 Redis Cluster：扩展容量

当单个 Redis 实例无法满足需求时，可以考虑使用 Redis Cluster 来扩展容量。Redis Cluster 可以将数据分散到多个节点上，提高并发处理能力。

五、高级玩法：更上一层楼

除了以上基本的用法和优化技巧，Sorted Set 还有一些更高级的玩法，可以让你在排行榜的道路上越走越远。

1. 多个维度排序：组合分数

有时候，我们需要根据多个维度对用户进行排序。例如，既要考虑用户的积分，又要考虑用户的活跃度。解决方法是将多个维度的分数进行组合，生成一个综合分数。

例如，假设用户的积分为 score1，活跃度为 score2，我们可以将综合分数设置为 score1 * factor1 + score2 * factor2，其中 factor1 和 factor2 是权重因子。

2. 实时计算排名：利用 ZREVRANGEBYSCORE

ZREVRANGEBYSCORE 命令可以按照分数范围获取元素。我们可以利用这个命令来实时计算用户的排名。

import redis

r = redis.Redis(host='localhost', port=6379, db=0)

def get_realtime_rank(user_id, leaderboard_key):
    """
    实时计算用户的排名。
    """
    user_score = r.zscore(leaderboard_key, user_id)
    if user_score is None:
        return None  # 用户不在排行榜中

    # 获取分数大于等于 user_score 的用户数量，即排名
    rank = r.zcount(leaderboard_key, user_score, '+inf')
    return rank

# 示例
rank = get_realtime_rank('user1', 'leaderboard')
print("user1 的实时排名:", rank)

这个方法的核心在于 zcount 命令，它可以快速统计指定分数范围内的元素数量。

3. 排行榜合并：ZUNIONSTORE 和 ZINTERSTORE

有时候，我们需要将多个排行榜合并成一个总榜。ZUNIONSTORE 命令可以将多个 Sorted Set 合并成一个，ZINTERSTORE 命令可以取多个 Sorted Set 的交集。

六、常见问题及解决方案

发表回复 取消回复

发表回复取消回复