Redis 作为消息队列：Streams 与 Pub/Sub 的应用场景与优劣势 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

好的，各位亲爱的程序员朋友们，大家好！我是你们的老朋友，江湖人称“Bug终结者”的码农老王。今天，咱们来聊聊Redis这位全能选手在消息队列领域的两大法宝：Streams和Pub/Sub。

大家知道，消息队列就像咱们现实生活中的快递系统，负责把消息从一个地方安全、高效地送到另一个地方。在分布式系统中，消息队列更是不可或缺的基石，它能帮助我们解耦服务、提高系统的可靠性和可伸缩性。

那么，Redis是如何胜任消息队列这个角色的呢？Streams和Pub/Sub又各自有什么绝招呢？别着急，听我慢慢道来，保证让你们听得津津有味，学得明明白白！

一、Redis Pub/Sub：广播电台的快乐时光

首先，我们来认识一下Redis Pub/Sub，这可是Redis家族里的老牌成员了。你可以把它想象成一个广播电台，发布者（Publisher）负责播报新闻（消息），订阅者（Subscriber）则选择自己感兴趣的频道（Channel）收听。

1. 工作原理

Pub/Sub的工作原理非常简单：

发布者： 使用PUBLISH channel message命令，将消息发布到指定的频道。
订阅者： 使用SUBSCRIBE channel1 channel2 ...命令，订阅一个或多个频道。一旦频道有新消息，Redis就会立即将消息推送给所有订阅者。

2. 应用场景

Pub/Sub非常适合以下场景：

实时消息推送： 比如在线聊天室、实时游戏等，需要将消息快速广播给所有在线用户。
事件通知： 比如监控系统，当某个事件发生时，需要通知所有相关的监控服务。
配置更新： 当配置发生变化时，通知所有需要使用该配置的服务。

3. 优劣势分析

特性	优势	劣势
实时性	非常高，消息几乎是实时推送给订阅者。
简单易用	API简单，容易上手。
解耦性	发布者和订阅者完全解耦，互不依赖。
可靠性	非常差！消息是“fire and forget”模式，Redis不会持久化消息，也不会保证消息一定被所有订阅者收到。如果订阅者离线，或者处理消息的速度跟不上发布者的速度，消息就会丢失。这就像电台广播，你没打开收音机，就听不到消息了 📻。
消息顺序	不保证消息的顺序。
消息持久化	不支持消息持久化。
消息确认	不支持消息确认机制。
消息回溯	不支持消息回溯，无法重新消费历史消息。

4. 使用示例

假设我们有一个在线聊天室，需要将用户的消息实时广播给所有在线用户。

# 发布者
import redis

r = redis.Redis(host='localhost', port=6379, db=0)

def publish_message(channel, message):
    r.publish(channel, message)
    print(f"已发布消息到频道 {channel}: {message}")

# 订阅者
import redis

r = redis.Redis(host='localhost', port=6379, db=0)
pubsub = r.pubsub()

def handle_message(message):
    print(f"收到消息: {message['data'].decode('utf-8')}")

pubsub.subscribe(**{'chat_channel': handle_message})  # 订阅chat_channel频道

thread = pubsub.run_in_thread(sleep_time=0.1) # 启动线程接收消息

# 发布消息
publish_message('chat_channel', 'Hello, everyone!')
publish_message('chat_channel', 'How are you doing?')

thread.stop() # 停止线程

二、Redis Streams：可靠的物流配送中心

接下来，我们来认识一下Redis Streams，这是Redis 5.0版本引入的重量级成员。你可以把它想象成一个物流配送中心，消息就像包裹，Streams负责将包裹安全、可靠地送到目的地。

1. 工作原理

Streams的工作原理相对复杂一些，但功能也更加强大：

生产者： 使用XADD stream_name * field1 value1 field2 value2 ...命令，将消息添加到指定的Stream中。每个消息都有一个唯一的ID，通常是时间戳加上序列号。
消费者： 可以通过以下几种方式消费Stream中的消息：
- 单个消费者： 使用XREAD COUNT count BLOCK milliseconds STREAMS stream_name id命令，从指定的Stream中读取消息。可以指定从哪个ID开始读取，以及一次读取多少条消息。
- 消费者组： 这是Streams最强大的特性之一。可以将多个消费者组成一个消费者组（Consumer Group），每个消费者负责消费Stream中的一部分消息。这样可以实现消息的并行处理，提高消费速度。使用XGROUP CREATE stream_name group_name id命令创建消费者组，使用XREADGROUP GROUP group_name consumer_name COUNT count BLOCK milliseconds STREAMS stream_name >命令从消费者组中读取消息。
消息确认： 消费者在处理完消息后，需要使用XACK stream_name group_name message_id命令向Streams确认消息已处理。如果消费者没有确认消息，Streams会将消息标记为待处理状态，并将其重新分配给其他消费者，或者在消费者下次上线时重新发送。
消息持久化： Streams会将所有消息持久化到磁盘上，即使Redis重启，消息也不会丢失。

2. 应用场景

Streams非常适合以下场景：

订单处理： 比如电商平台的订单处理流程，需要保证订单消息不丢失、不重复，并且按照顺序处理。
日志收集： 比如收集服务器的日志，需要将日志消息可靠地存储起来，并进行分析。
事件溯源： 比如记录用户的操作历史，需要将用户的操作消息持久化存储，并可以回溯到任何一个时间点。

3. 优劣势分析

特性	优势	劣势
实时性	相对较高，但不如Pub/Sub。
复杂性	API相对复杂，需要一定的学习成本。
可靠性	非常高！消息持久化到磁盘，支持消息确认机制，保证消息不丢失、不重复。这就像物流配送中心，即使遇到恶劣天气，也会尽力将包裹送到你手中 📦。
消息顺序	严格保证消息的顺序。
消息持久化	支持消息持久化。
消息确认	支持消息确认机制。
消息回溯	支持消息回溯，可以重新消费历史消息。
消费者组	支持消费者组，可以实现消息的并行处理。
内存占用	相对较高，因为需要持久化消息。	在高并发场景下，需要仔细评估内存占用情况。

4. 使用示例

假设我们有一个订单处理系统，需要将订单消息可靠地存储起来，并按照顺序处理。

# 生产者
import redis

r = redis.Redis(host='localhost', port=6379, db=0)

def add_order(order_id, customer_id, amount):
    r.xadd('order_stream', {'order_id': order_id, 'customer_id': customer_id, 'amount': amount})
    print(f"已添加订单 {order_id} 到 Stream")

# 消费者
import redis

r = redis.Redis(host='localhost', port=6379, db=0)
group_name = 'order_group'
consumer_name = 'consumer_1'
stream_name = 'order_stream'

# 尝试创建消费者组，如果已存在则忽略
try:
    r.xgroup_create(stream_name, group_name, id='0')
except redis.exceptions.ResponseError as e:
    if 'BUSYGROUP' in str(e):
        print(f"消费者组 {group_name} 已存在，跳过创建")
    else:
        raise e

def consume_orders():
    while True:
        # 读取未确认的消息
        response = r.xreadgroup(groupname=group_name, consumername=consumer_name, streams={stream_name: '>'}, count=1, block=1000)
        if response:
            stream_name, messages = response[0]
            for message_id, message_data in messages:
                order_id = message_data[b'order_id'].decode('utf-8')
                customer_id = message_data[b'customer_id'].decode('utf-8')
                amount = message_data[b'amount'].decode('utf-8')

                print(f"消费者 {consumer_name} 收到订单 {order_id}, 客户ID: {customer_id}, 金额: {amount}")

                # 模拟订单处理
                print(f"正在处理订单 {order_id}...")
                # 假设这里有订单处理的逻辑
                import time
                time.sleep(1)
                print(f"订单 {order_id} 处理完成")

                # 确认消息
                r.xack(stream_name, group_name, message_id)
                print(f"已确认消息 {message_id.decode('utf-8')}")
        else:
            print("没有新的订单消息...")
# 添加订单
add_order('order_1', 'customer_1', '100')
add_order('order_2', 'customer_2', '200')
add_order('order_3', 'customer_3', '300')

consume_orders()

三、总结与选择

好了，讲了这么多，相信大家对Redis Pub/Sub和Streams都已经有了比较深入的了解。那么，在实际项目中，我们应该如何选择呢？

Pub/Sub： 如果你追求的是极致的实时性，并且可以容忍消息丢失，那么Pub/Sub是一个不错的选择。它简单易用，性能也很高，非常适合实时消息推送、事件通知等场景。
Streams： 如果你对消息的可靠性、顺序性有很高的要求，并且需要支持消息回溯、并行处理等高级特性，那么Streams是你的不二之选。它功能强大，可以满足各种复杂的消息队列需求，但同时也需要付出一定的学习成本。

总而言之，选择哪种方案，取决于你的具体需求。就像选择交通工具一样，如果你只是想在小区里溜达溜达，自行车就够了；但如果你想去远方旅行，那还是坐飞机更靠谱 ✈️。

四、一些额外的建议

监控： 无论是Pub/Sub还是Streams，都需要进行有效的监控。监控消息的生产速度、消费速度、积压情况等指标，可以帮助你及时发现问题，并进行优化。
调优： Redis的性能调优也是非常重要的。合理配置Redis的内存大小、持久化策略等参数，可以提高消息队列的性能和可靠性。
容错： 在分布式系统中，容错是必不可少的。可以考虑使用Redis Sentinel或Redis Cluster来提高Redis的可用性。

好了，今天的分享就到这里。希望这篇文章能帮助大家更好地理解Redis在消息队列领域的应用。记住，没有最好的方案，只有最合适的方案。根据你的实际需求，选择最适合你的工具，才能事半功倍！

如果大家还有什么疑问，欢迎在评论区留言，我会尽力解答。也欢迎大家关注我的公众号“码农老王”，我会定期分享更多有趣、实用的技术知识。

感谢大家的收听，我们下期再见！👋

发表回复 取消回复

发表回复取消回复