Redis 在排行榜系统中的高效应用：Sorted Set 的妙用 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

Redis 在排行榜系统中的高效应用：Sorted Set 的妙用 (一场轻松愉快的技术漫谈)

各位观众老爷们，大家好！我是你们的老朋友，人见人爱的码农小李。今天，咱们不聊那些高大上的架构，也不谈那些深奥的算法，就来唠唠嗑，聊聊咱们日常开发中经常用到的排行榜系统，以及Redis中的Sorted Set是如何在其中大显身手的。

你可能要问了，排行榜系统？这玩意儿谁不会啊？ORDER BY 一下，取个 LIMIT 就完事儿了嘛！没错，理论上是这样，但是，当你的用户量达到百万、千万级别，甚至更高的时候，数据库那小身板可就有点吃不消了。每次都全表扫描排序，那服务器CPU估计都要烧起来，到时候老板给你泡的枸杞茶都救不了你！

所以，我们需要一个更高效、更优雅的解决方案。而Redis的Sorted Set，就是那个能让你在老板面前昂首挺胸，自信满满的秘密武器！

什么是Sorted Set？它为什么如此优秀？

Sorted Set，顾名思义，是一个有序的集合。它和普通的Set集合的区别在于，每个元素都关联了一个分数（score），Redis正是通过这个分数来对集合中的元素进行排序。

你可以把Sorted Set想象成一个武林高手排行榜，每个高手都有一个战力值（score），战力值越高，排名越高。Redis会根据这个战力值，自动帮你把高手们排好，你想看前十名，直接拿就是了，根本不需要你费心费力地排序。

Sorted Set之所以如此优秀，是因为它底层使用了跳跃表（Skip List）这种数据结构。跳跃表是一种基于链表的概率型数据结构，它通过建立多层索引，实现了快速的查找、插入和删除操作。

跳跃表的好处：

查询效率高： 接近O(logN)，远高于普通链表的O(N)。
插入/删除效率高： 同样接近O(logN)，不需要像平衡树那样进行复杂的旋转操作。
实现简单： 相对于平衡树来说，跳跃表的实现更加简单，更容易理解和维护。

我们可以用一张表格来对比一下Sorted Set和其他数据结构的性能：

数据结构	查找	插入	删除	排序能力
数组	O(N)	O(N)	O(N)	需要排序
链表	O(N)	O(1)	O(1)	需要排序
平衡树	O(logN)	O(logN)	O(logN)	自带排序
Hash Table	O(1) (平均)	O(1) (平均)	O(1) (平均)	无
Sorted Set	O(logN)	O(logN)	O(logN)	自带排序

从表格中可以看出，Sorted Set在拥有高效的查找、插入和删除性能的同时，还自带排序功能，简直是为排行榜系统量身定制！

如何使用Sorted Set构建排行榜系统？

现在，让我们进入实战环节，看看如何使用Sorted Set来构建一个简单的排行榜系统。

场景：

假设我们有一个游戏，需要根据玩家的得分来显示排行榜。

步骤：

添加玩家得分：

可以使用 ZADD key score member 命令来添加玩家的得分。例如，要添加玩家 "张三" 的得分为1000，可以使用以下命令：
```
ZADD leaderboard 1000 张三
```
如果要同时添加多个玩家的得分，可以使用以下命令：
```
ZADD leaderboard 2000 李四 1500 王五 1800 赵六
```
获取排行榜：

可以使用 ZRANGE key start stop [WITHSCORES] 命令来获取排行榜。例如，要获取排行榜前10名，可以使用以下命令：
```
ZRANGE leaderboard 0 9 WITHSCORES
```
这条命令会返回一个包含前10名玩家及其得分的列表。WITHSCORES 参数表示同时返回得分。
获取玩家排名：

可以使用 ZRANK key member 命令来获取玩家的排名。例如，要获取玩家 "李四" 的排名，可以使用以下命令：
```
ZRANK leaderboard 李四
```
这条命令会返回玩家 "李四" 在排行榜中的排名（从0开始）。
更新玩家得分：

如果玩家的得分发生了变化，可以使用 ZADD key score member 命令来更新玩家的得分。例如，要将玩家 "张三" 的得分更新为1200，可以使用以下命令：
```
ZADD leaderboard 1200 张三
```
注意：即使玩家已经存在于Sorted Set中，ZADD 命令也会更新其得分。
删除玩家：

可以使用 ZREM key member 命令来删除玩家。例如，要删除玩家 "王五"，可以使用以下命令：
```
ZREM leaderboard 王五
```

代码示例 (Python)：

import redis

# 连接Redis
r = redis.Redis(host='localhost', port=6379, db=0)

# 添加玩家得分
r.zadd('leaderboard', {'张三': 1000, '李四': 2000, '王五': 1500, '赵六': 1800})

# 获取排行榜前10名
top10 = r.zrange('leaderboard', 0, 9, withscores=True, desc=True)
print("排行榜前10名：", top10)

# 获取玩家排名
rank = r.zrank('leaderboard', '李四')
print("李四的排名：", rank)

# 更新玩家得分
r.zadd('leaderboard', {'张三': 1200})

# 删除玩家
r.zrem('leaderboard', '王五')

运行结果：

排行榜前10名： [(b'xe6x9dx8exe5x9bx9b', 2000.0), (b'xe8xb5xb5xe5x85xad', 1800.0), (b'xe5xbcxa0xe4xb8x89', 1200.0)]
李四的排名： 0

总结：

使用Sorted Set构建排行榜系统非常简单，只需要几个简单的命令就可以实现。而且，由于Sorted Set底层使用了跳跃表这种高效的数据结构，即使在用户量很大的情况下，也能保证排行榜的性能。

Sorted Set 的高级应用：超越排行榜的想象

Sorted Set 的强大之处远不止于简单的排行榜。它还可以应用于各种需要排序和范围查询的场景。

1. 时间线（Timeline）：

你可以使用Sorted Set来存储用户的动态，以动态的发布时间作为score，这样就可以按照时间顺序获取用户的动态了。

# 添加动态
r.zadd('timeline:user1', { '动态内容1': time.time() })
r.zadd('timeline:user1', { '动态内容2': time.time() + 10 })

# 获取最新动态
latest_news = r.zrange('timeline:user1', 0, 9, withscores=True, desc=True)
print("最新动态：", latest_news)

2. 延迟队列：

你可以将需要延迟执行的任务添加到Sorted Set中，以任务的执行时间作为score。然后，使用一个后台线程定期扫描Sorted Set，取出所有score小于当前时间的任务，并执行它们。

import time

# 添加延迟任务
r.zadd('delay_queue', {'任务1': time.time() + 60}) # 60秒后执行
r.zadd('delay_queue', {'任务2': time.time() + 120}) # 120秒后执行

# 后台线程
while True:
    # 获取需要执行的任务
    now = time.time()
    tasks = r.zrangebyscore('delay_queue', 0, now)

    # 执行任务
    for task in tasks:
        print("执行任务：", task)
        r.zrem('delay_queue', task) # 执行完删除任务

    time.sleep(1)

3. 热门文章/商品：

你可以使用Sorted Set来存储文章/商品的点击量，以点击量作为score。然后，定期更新Sorted Set，并获取点击量最高的文章/商品。

# 增加文章点击量
r.zincrby('articles', 1, '文章ID1')
r.zincrby('articles', 1, '文章ID2')

# 获取热门文章
top_articles = r.zrange('articles', 0, 9, withscores=True, desc=True)
print("热门文章：", top_articles)

4. 积分系统：

Sorted Set 可以完美地应用于积分系统，每个用户的积分作为 score 存储，可以方便地进行积分的增加、减少，以及查询用户的积分排名。

# 增加用户积分
r.zincrby('user_points', 100, '用户ID1')

# 获取用户积分排名
rank = r.zrank('user_points', '用户ID1')
print("用户ID1的积分排名：", rank)

5. 附近的人：

虽然 Redis 本身没有地理位置索引功能，但结合 Sorted Set 和 GeoHash 技术，可以实现 “附近的人” 功能。将用户的 GeoHash 值作为 score 存储到 Sorted Set 中，然后通过范围查询，找到附近的人。

总结：

Sorted Set的应用场景非常广泛，只要涉及到排序和范围查询，都可以考虑使用它。它可以帮助你简化开发，提高性能，让你的代码更加优雅。

Sorted Set 的注意事项：避免踩坑指南

虽然Sorted Set很强大，但是在实际使用中，还是有一些需要注意的地方，避免踩坑。

1. Score的精度问题：

Sorted Set的Score是double类型的，所以存在精度问题。如果你的业务场景对精度要求很高，需要考虑使用其他方案，例如将Score转换成整数存储。

2. 大Key问题：

如果Sorted Set中的元素数量非常多，可能会导致大Key问题，影响Redis的性能。建议对Key进行拆分，或者使用Redis Cluster。

3. 内存消耗：

Sorted Set的底层使用了跳跃表，相对来说比较消耗内存。需要根据实际情况，评估内存使用情况，并进行优化。

4. 并发问题：

在并发场景下，需要注意Sorted Set的并发修改问题。可以使用乐观锁或悲观锁来解决。

5. 避免频繁更新：

频繁更新 Score 会导致跳跃表频繁调整，影响性能。尽量批量更新，或者设计更合理的更新策略。

总结：

在使用Sorted Set的时候，要充分考虑业务场景，合理设计Key和Score，并注意一些潜在的问题，才能充分发挥Sorted Set的优势。

结语：Sorted Set，你的技术百宝箱

好了，各位观众老爷们，今天的分享就到这里了。希望通过今天的讲解，大家能够对Redis的Sorted Set有一个更深入的了解，并在实际开发中灵活运用它，让你的代码更加高效、优雅。

Sorted Set就像一个百宝箱，里面装满了各种各样的工具，只要你善于发现，就能找到适合你的那一个。记住，技术只是工具，关键在于如何使用它来解决实际问题。

最后，祝大家编码愉快，Bug少少！咱们下期再见！ ?

Redis 在排行榜系统中的高效应用：Sorted Set 的妙用 (一场轻松愉快的技术漫谈)

什么是Sorted Set？它为什么如此优秀？

如何使用Sorted Set构建排行榜系统？

Sorted Set 的高级应用：超越排行榜的想象

Sorted Set 的注意事项：避免踩坑指南

结语：Sorted Set，你的技术百宝箱

发表回复 取消回复

发表回复取消回复