Redis `Set` 集合的高级应用：用户标签、共同好友等 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

各位观众，晚上好！欢迎来到今晚的“Redis骚操作”讲座。今天咱们要聊的是Redis Set集合，这玩意儿可不是简单的存几个字符串就完事儿的，它能玩出很多花样，特别是跟用户标签、共同好友这些场景结合起来，简直是如虎添翼。

一、Redis Set：集合的本质和特性

首先，咱们得搞清楚Set是个什么玩意儿。你可以把它想象成一个袋子，这个袋子里装了很多东西（也就是字符串），但是有个规矩：

唯一性： 袋子里不能有重复的东西，放进去重复的会自动忽略。
无序性： 袋子里的东西没有特定的顺序，你想按照什么顺序拿出来，那是你的事儿。

Redis Set 提供了以下常用命令：

命令	描述	示例
`SADD key member [member ...]`	向集合 `key` 中添加一个或多个成员。	`SADD user:1:tags "geek" "developer"`
`SMEMBERS key`	返回集合 `key` 中的所有成员。	`SMEMBERS user:1:tags`
`SISMEMBER key member`	判断 `member` 元素是否是集合 `key` 的成员。	`SISMEMBER user:1:tags "geek"`
`SREM key member [member ...]`	移除集合 `key` 中一个或多个成员。	`SREM user:1:tags "geek"`
`SCARD key`	返回集合 `key` 的基数(集合中元素的数量)。	`SCARD user:1:tags`
`SINTER key [key ...]`	返回给定所有集合的交集。	`SINTER user:1:friends user:2:friends`
`SUNION key [key ...]`	返回给定所有集合的并集。	`SUNION user:1:interests user:2:interests`
`SDIFF key [key ...]`	返回给定集合之间的差集。	`SDIFF user:1:followers user:1:following`
`SRANDMEMBER key [count]`	随机返回集合中指定数量的元素。如果count为正数，且小于集合长度，则返回count个不重复的元素。如果count为正数，且大于等于集合长度，则返回整个集合。如果count为负数，则返回	`SRANDMEMBER user:1:tags 2`
`SPOP key [count]`	移除并返回集合中的一个或多个随机元素。	`SPOP user:1:queue 2`
`SMOVE source destination member`	将 `member` 元素从 `source` 集合移动到 `destination` 集合。	`SMOVE user:1:pending_friends user:1:friends user:2`

二、用户标签：精准画像，个性推荐

用户标签，就是给用户打上各种各样的“标记”，用来描述用户的特征、兴趣、行为等等。有了这些标签，我们就能更精准地了解用户，从而提供更个性化的服务。

怎么用 Redis Set 实现用户标签呢？

存储结构：
- key: user:{用户ID}:tags (例如：user:123:tags)
- value: 标签列表 (例如："程序员", "游戏爱好者", "电影达人")

添加标签：

import redis

# 连接Redis
r = redis.Redis(host='localhost', port=6379, db=0)

user_id = 123
tags = ["程序员", "游戏爱好者", "电影达人"]

# 使用 SADD 添加标签
r.sadd(f"user:{user_id}:tags", *tags)

print(f"用户 {user_id} 添加了标签：{tags}")

获取标签：

# 使用 SMEMBERS 获取标签
user_tags = r.smembers(f"user:{user_id}:tags")
user_tags = [tag.decode('utf-8') for tag in user_tags] # 将字节转换为字符串

print(f"用户 {user_id} 的标签：{user_tags}")

删除标签：

# 使用 SREM 删除标签
tag_to_remove = "游戏爱好者"
r.srem(f"user:{user_id}:tags", tag_to_remove)

print(f"用户 {user_id} 移除了标签：{tag_to_remove}")

判断用户是否拥有某个标签：

# 使用 SISMEMBER 判断是否存在标签
is_geek = r.sismember(f"user:{user_id}:tags", "程序员")

print(f"用户 {user_id} 是否是程序员：{is_geek}")

代码解释：

redis.Redis()：连接Redis数据库。
r.sadd(key, *values)：将多个值添加到指定的key的集合中。*values 是Python的解包操作，将列表中的元素作为单独的参数传递给sadd。
r.smembers(key)：获取指定key集合中的所有成员，返回的是一个字节集合，需要解码为字符串。
r.srem(key, value)：从指定key的集合中移除指定的值。
r.sismember(key, value)：判断指定的值是否是指定key的集合的成员，返回True或False。
f"user:{user_id}:tags"：使用了Python的f-string，方便构建key。

应用场景：

个性化推荐： 根据用户的标签，推荐相关的商品、内容、服务。
精准营销： 根据用户的标签，推送符合用户兴趣的广告。
用户分群： 根据用户的标签，将用户划分为不同的群体，进行差异化运营。

三、共同好友：社交关系，快速查找

在社交应用中，查找共同好友是一个常见的功能。用 Redis Set 来实现这个功能，效率杠杠的。

存储结构：
- key: user:{用户ID}:friends (例如：user:1:friends)
- value: 好友ID列表 (例如：2, 3, 4)

添加好友：

import redis

r = redis.Redis(host='localhost', port=6379, db=0)

user_id = 1
friend_id = 2

# 互相添加好友
r.sadd(f"user:{user_id}:friends", friend_id)
r.sadd(f"user:{friend_id}:friends", user_id)

print(f"用户 {user_id} 添加了好友 {friend_id}")

查找共同好友：

user_id1 = 1
user_id2 = 3

# 使用 SINTER 查找共同好友
common_friends = r.sinter(f"user:{user_id1}:friends", f"user:{user_id2}:friends")
common_friends = [int(friend_id.decode('utf-8')) for friend_id in common_friends] # 将字节转换为整数

print(f"用户 {user_id1} 和用户 {user_id2} 的共同好友：{common_friends}")

代码解释：

r.sinter(key1, key2)：返回两个集合的交集，也就是共同好友的ID列表。
int(friend_id.decode('utf-8'))：将字节形式的好友ID转换为整数。

应用场景：

社交应用： 查找共同好友，扩展社交圈。
推荐系统： 推荐可能认识的人，提高用户活跃度。

四、集合运算：更多骚操作

除了查找共同好友，Redis Set 还能进行其他集合运算，比如：

并集（SUNION）： 返回多个集合的并集，可以用来查找用户的共同兴趣。
差集（SDIFF）： 返回一个集合与其他集合的差集，可以用来查找用户的潜在好友。

示例：

import redis

r = redis.Redis(host='localhost', port=6379, db=0)

user_id = 1

# 用户关注的人
r.sadd(f"user:{user_id}:following", 2, 3, 4)

# 用户的粉丝
r.sadd(f"user:{user_id}:followers", 3, 5, 6)

# 查找用户关注但不是粉丝的人（潜在好友）
potential_friends = r.sdiff(f"user:{user_id}:following", f"user:{user_id}:followers")
potential_friends = [int(friend_id.decode('utf-8')) for friend_id in potential_friends]

print(f"用户 {user_id} 的潜在好友：{potential_friends}")

五、实战案例：构建一个简单的推荐系统

现在，咱们来结合用户标签和共同好友，构建一个简单的推荐系统。假设我们要给用户推荐电影，根据用户的标签和好友的观影记录进行推荐。

数据准备：
- 用户标签： user:{用户ID}:tags (例如：user:1:tags, "喜剧", "爱情")
- 用户观影记录： user:{用户ID}:movies (例如：user:1:movies, "电影A", "电影B")
推荐逻辑：
- 标签匹配： 根据用户的标签，筛选出包含相同标签的电影。
- 好友推荐： 根据用户的好友的观影记录，推荐好友看过的电影。
- 合并结果： 将标签匹配和好友推荐的结果合并，并进行排序，推荐给用户。

代码实现：

import redis

r = redis.Redis(host='localhost', port=6379, db=0)

def recommend_movies(user_id, num_recommendations=5):
    """
    根据用户标签和好友的观影记录，推荐电影。

    Args:
        user_id: 用户ID。
        num_recommendations: 推荐电影的数量。

    Returns:
        推荐电影的列表。
    """

    # 1. 获取用户标签
    user_tags = r.smembers(f"user:{user_id}:tags")
    user_tags = [tag.decode('utf-8') for tag in user_tags]

    # 2. 获取用户好友
    user_friends = r.smembers(f"user:{user_id}:friends")
    user_friends = [int(friend_id.decode('utf-8')) for friend_id in user_friends]

    # 3. 标签匹配：筛选出包含相同标签的电影
    tag_matched_movies = set()
    for tag in user_tags:
        # 假设我们有一个电影标签索引：movie:{tag}:users，存储了包含该标签的电影对应的用户
        # 例如 movie:喜剧:users 存储了所有喜欢喜剧电影的用户。
        # 为了简化，这里假设我们直接能根据标签获取电影列表
        movies_with_tag = get_movies_by_tag(tag) # 假设这个函数能根据标签获取电影
        tag_matched_movies.update(movies_with_tag)

    # 4. 好友推荐：根据用户的好友的观影记录，推荐好友看过的电影
    friend_watched_movies = set()
    for friend_id in user_friends:
        friend_movies = r.smembers(f"user:{friend_id}:movies")
        friend_movies = [movie.decode('utf-8') for movie in friend_movies]
        friend_watched_movies.update(friend_movies)

    # 5. 合并结果，并排除用户已经看过的电影
    user_watched_movies = r.smembers(f"user:{user_id}:movies")
    user_watched_movies = [movie.decode('utf-8') for movie in user_watched_movies]
    recommended_movies = (tag_matched_movies | friend_watched_movies) - set(user_watched_movies)

    # 6. 排序（这里简单地使用随机排序）
    import random
    recommended_movies = list(recommended_movies)
    random.shuffle(recommended_movies)

    # 7. 返回推荐结果
    return recommended_movies[:num_recommendations]

def get_movies_by_tag(tag):
    # 模拟根据标签获取电影的函数
    # 在真实环境中，这个函数会查询数据库或者其他存储系统
    if tag == "喜剧":
        return ["电影A", "电影C", "电影E"]
    elif tag == "爱情":
        return ["电影B", "电影D", "电影F"]
    else:
        return []

# 示例用法
user_id = 1
recommended_movies = recommend_movies(user_id)
print(f"为用户 {user_id} 推荐的电影：{recommended_movies}")

代码解释：

recommend_movies(user_id, num_recommendations)：推荐电影的主函数。
get_movies_by_tag(tag)：根据标签获取电影的函数（这里只是一个模拟函数，实际需要查询数据库）。
代码逻辑：
1. 获取用户的标签和好友列表。
2. 根据标签，筛选出包含相同标签的电影。
3. 根据好友的观影记录，推荐好友看过的电影。
4. 合并结果，并排除用户已经看过的电影。
5. 排序并返回推荐结果。

六、注意事项

数据量： 当用户数量和标签数量非常大时，SMEMBERS 命令可能会导致性能问题。可以考虑使用分页或者其他优化策略。
数据一致性： 在分布式环境下，需要保证数据的一致性。可以使用 Redis 的事务或者分布式锁来解决。
Key的设计： Key的设计非常重要，要保证Key的可读性和可维护性。

七、总结

Redis Set 集合是一个非常强大的数据结构，可以用来解决很多实际问题。今天我们介绍了用户标签、共同好友和简单的推荐系统，希望能给大家带来一些启发。记住，Redis 的骚操作远不止这些，只要你敢想，就能用它玩出更多花样！

好了，今天的讲座就到这里，谢谢大家！

发表回复 取消回复

发表回复取消回复