`XREAD` 与 `XREADGROUP`：Streams 的消费者组读取与消息确认 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

好的，各位技术爱好者，今天咱们就来聊聊 Redis Streams 里的两个重量级选手：XREAD 和 XREADGROUP。这两个命令啊，就像是河流里的两条船，一艘单人漂流，一艘组团出海，各有千秋，但目标都是——捞鱼（也就是读取消息）！🐟

准备好了吗？系好安全带，咱们要启航啦！🚀

第一章：单人漂流记：`XREAD` 的自由与限制

首先，让我们聚焦 XREAD。你可以把它想象成一位孤独的探险家，独自一人，划着小船，在 Redis Streams 这条消息之河上自由漂流。

1.1 `XREAD` 的基本用法：简单直接，拿来就用

XREAD 的基本语法非常简单，就像一句简洁的诗：

XREAD [COUNT <count>] [BLOCK <milliseconds>] STREAMS <key> [<key> ...] <id> [<id> ...]

COUNT <count>: 你想一次捞多少条鱼？这个参数就是告诉你，最多读取多少条消息。如果不写，默认是尽可能多地读取。
BLOCK <milliseconds>: 如果你想做一个佛系渔夫，没鱼也不急，就用这个参数。它可以让 XREAD 命令阻塞一段时间，直到有新消息到来，或者超时。
STREAMS <key> [<key> ...]: 指定你要读取哪个（或哪些）Stream。就像告诉船夫，你要去哪条河段捕鱼。
<id> [<id> ...]: 从哪个消息 ID 开始读取？这就像是告诉船夫，从河流的哪个位置开始漂流。$ 特殊 ID 表示从 Stream 的末尾开始读取新消息，0 表示从 Stream 的最早的消息开始读取。

举个例子，如果我们想从名为 my_stream 的 Stream 中读取最新的消息，可以这样写：

XREAD COUNT 5 STREAMS my_stream $

这条命令的意思是：最多读取 5 条 my_stream 的最新消息。

1.2 `XREAD` 的优势：灵活，简单，适合个人项目

XREAD 的优势在于它的简单和灵活。

易于上手: 语法简洁，理解成本低，适合快速开发和原型验证。
无需配置: 不需要创建消费者组，直接就可以使用，省去了很多麻烦。
适合个人项目: 对于消息量不大，并发要求不高的场景，XREAD 完全可以胜任。

1.3 `XREAD` 的局限性：并发不高，消息丢失风险

但是，XREAD 也有它的局限性。

并发不高: 多个客户端同时使用 XREAD 读取同一个 Stream，可能会出现重复消费的情况。就像多个人同时用网捕鱼，你捞一条，我捞一条，最后可能重复。
消息丢失风险: 如果客户端在读取消息后崩溃，没有及时处理，那么这些消息就会丢失。就像渔夫捞到鱼后，还没来得及放进鱼篓，结果一不小心翻船了，鱼都跑了！
缺乏ACK机制:没有消费确认机制，无法保证消息被成功处理。

总的来说，XREAD 就像一个单人漂流者，自由自在，但也面临着风浪的考验。它适合小规模、低并发的场景，或者用于快速验证想法。

第二章：组团出海：`XREADGROUP` 的力量与责任

接下来，让我们把目光转向 XREADGROUP。这可不是单打独斗了，而是一个团队合作，就像一个专业的捕鱼队，分工明确，效率更高。

2.1 消费者组的概念：分工协作，提高效率

在深入 XREADGROUP 之前，我们需要了解一下消费者组的概念。

消费者组（Consumer Group）是 Redis Streams 中实现并发消费的关键。它可以将一个 Stream 的消息分发给多个消费者（Consumer），每个消费者只负责处理一部分消息，从而提高整体的消费速度。

你可以把消费者组想象成一个车队，每辆车（消费者）负责运输一部分货物（消息），最终把货物运送到目的地。

2.2 `XREADGROUP` 的基本用法：指定组，指定人，按需读取

XREADGROUP 的语法稍微复杂一些，但也更有力量：

XREADGROUP GROUP <groupname> <consumername> [COUNT <count>] [BLOCK <milliseconds>] [NOACK] STREAMS <key> [<key> ...] <id> [<id> ...]

GROUP <groupname> <consumername>: 这是 XREADGROUP 最重要的参数，它指定了消费者组的名称和当前消费者的名称。就像告诉车队，你是哪个小组的，你的名字是什么。
COUNT <count>: 和 XREAD 一样，指定最多读取多少条消息。
BLOCK <milliseconds>: 阻塞等待新消息。
NOACK: 这个参数比较特殊，如果指定了 NOACK，那么消费者在读取消息后，就不需要手动确认消息了。这就像是告诉车队，货物直接运到目的地就行，不需要签收。但是，使用 NOACK 会增加消息丢失的风险，所以要谨慎使用。
STREAMS <key> [<key> ...]: 指定要读取的 Stream。
<id> [<id> ...]: 指定从哪个消息 ID 开始读取。> 特殊 ID 表示从消费者组未确认的消息中读取，通常用于消费者重启后继续消费未完成的消息。

举个例子，如果我们想让名为 consumer1 的消费者从名为 my_group 的消费者组中读取 my_stream 的未确认消息，可以这样写：

XREADGROUP GROUP my_group consumer1 COUNT 5 STREAMS my_stream >

这条命令的意思是：让 consumer1 从 my_group 消费者组中读取最多 5 条 my_stream 的未确认消息。

2.3 `XREADGROUP` 的优势：高并发，消息可靠，ACK机制

XREADGROUP 的优势非常明显。

高并发: 通过消费者组，可以将消息分发给多个消费者并行处理，大大提高了并发处理能力。就像一个车队同时运输货物，效率自然更高。
消息可靠: XREADGROUP 引入了 ACK 机制（Acknowledgment），消费者在处理完消息后，需要手动确认消息，告诉 Redis 消息已经被成功处理。如果消费者在处理消息的过程中崩溃，没有及时确认消息，那么 Redis 会将这些消息重新分配给其他消费者，保证消息不会丢失。就像货物运输完成后，需要签收，确保货物安全到达。
消息持久化：Stream 消息存储在 Redis 中，可以持久化到磁盘，保证消息不丢失。

2.4 `XREADGROUP` 的局限性：配置复杂，需要手动ACK

当然，XREADGROUP 也有它的局限性。

配置复杂: 需要先创建消费者组，再启动消费者，配置相对复杂。
需要手动ACK: 消费者需要手动确认消息，增加了代码的复杂度。
需要处理pending消息: 消费者重启或者故障恢复后，需要处理pending消息，增加的业务复杂度。

总的来说，XREADGROUP 就像一个专业的捕鱼队，分工明确，效率更高，但也需要更多的协调和管理。它适合高并发、对消息可靠性要求高的场景。

第三章：ACK机制：消息确认的艺术

ACK 机制是 XREADGROUP 的灵魂，它保证了消息的可靠性。

3.1 什么是ACK？为什么要ACK？

ACK（Acknowledgment）就是消息确认的意思。当消费者成功处理完一条消息后，需要告诉 Redis 消息已经被成功处理。

为什么要 ACK 呢？因为在分布式系统中，网络不稳定、服务崩溃等问题是不可避免的。如果没有 ACK 机制，那么消费者在处理消息的过程中崩溃，Redis 就无法知道消息是否被成功处理，从而导致消息丢失。

ACK 机制就像一个保险，它可以保证在出现问题时，消息不会丢失。

3.2 如何ACK？`XACK` 命令

XACK 命令用于手动确认消息。它的语法很简单：

XACK <key> <groupname> <id> [<id> ...]

<key>: Stream 的名称。
<groupname>: 消费者组的名称。
<id> [<id> ...]: 要确认的消息 ID。

举个例子，如果我们想确认 my_stream 中 my_group 消费者组的消息 1678886400000-0，可以这样写：

XACK my_stream my_group 1678886400000-0

3.3 Pending Entries List (PEL)：未确认消息的“待办事项”

Redis Streams 会维护一个 Pending Entries List (PEL)，用于记录所有已经发送给消费者，但尚未被确认的消息。你可以把 PEL 想象成一个“待办事项”列表，记录着哪些消息还没有完成。

每个消费者组都有自己的 PEL，PEL 中记录着每个消费者未确认的消息 ID。

当消费者崩溃或超时未确认消息时，Redis 会将这些消息重新放回 PEL 中，等待其他消费者重新消费。

3.4 查看PEL：`XPENDING` 命令

XPENDING 命令用于查看 PEL 的信息。它的语法如下：

XPENDING <key> <groupname> [<start> <end> <count>] [<consumername>]

<key>: Stream 的名称。
<groupname>: 消费者组的名称。
[<start> <end> <count>]: 可选参数，用于指定要查看的消息 ID 范围和数量。
[<consumername>]: 可选参数，用于指定要查看哪个消费者的未确认消息。

通过 XPENDING 命令，我们可以了解消费者组的消费情况，及时发现和处理未确认的消息。

第四章：实战演练：一个完整的消费流程

现在，让我们通过一个完整的例子，来演示如何使用 XREADGROUP 实现可靠的消息消费。

4.1 创建Stream和消费者组

首先，我们需要创建一个 Stream 和一个消费者组。

XGROUP CREATE my_stream my_group 0 MKSTREAM

这条命令的意思是：创建一个名为 my_stream 的 Stream，并创建一个名为 my_group 的消费者组，从 Stream 的最早的消息开始消费。MKSTREAM 选项表示如果 Stream 不存在，就自动创建。

4.2 生产者发送消息

接下来，我们需要一个生产者来向 Stream 中发送消息。

XADD my_stream * message "Hello, Redis Streams!"

这条命令的意思是：向 my_stream 中添加一条消息，内容为 "Hello, Redis Streams!"。* 表示让 Redis 自动生成消息 ID。

4.3 消费者读取消息

现在，让我们启动一个消费者来读取消息。

XREADGROUP GROUP my_group consumer1 COUNT 1 STREAMS my_stream >

这条命令的意思是：让 consumer1 从 my_group 消费者组中读取一条 my_stream 的未确认消息。

4.4 消费者处理消息并ACK

消费者在读取到消息后，需要进行处理，然后手动确认消息。

import redis

r = redis.Redis(host='localhost', port=6379, decode_responses=True)

def consume_message(group_name, consumer_name, stream_name):
    """从Stream中读取消息并处理，然后进行ACK."""
    response = r.xreadgroup(
        groupname=group_name,
        consumername=consumer_name,
        streams={stream_name: '>'},  # '>'表示从消费者组未确认的消息开始读取
        count=1,
        block=5000  # 阻塞5秒
    )

    if response:
        stream_name, messages = response[0]
        for message_id, message_data in messages:
            print(f"Consumer {consumer_name} received message: {message_data} with ID: {message_id}")

            # 模拟消息处理
            print(f"Consumer {consumer_name} processing message...")
            # time.sleep(1)  # 模拟处理时间

            # 确认消息
            r.xack(stream_name, group_name, message_id)
            print(f"Consumer {consumer_name} acknowledged message ID: {message_id}")
    else:
        print(f"Consumer {consumer_name} - No new messages in stream {stream_name}.")

# 配置
stream_name = 'my_stream'
group_name = 'my_group'
consumer_name = 'consumer1'

# 创建消费者组 (如果还没有创建)
try:
    r.xgroup_create(stream_name, group_name, id='0', mkstream=True)
    print(f"Consumer group {group_name} created successfully.")
except redis.exceptions.ResponseError as e:
    if 'BUSYGROUP Consumer Group name already exists' in str(e):
        print(f"Consumer group {group_name} already exists.")
    else:
        raise e

# 循环消费消息
consume_message(group_name, consumer_name, stream_name)

4.5 消费者崩溃模拟

现在，让我们模拟消费者崩溃的情况。假设 consumer1 在处理完消息后，还没有来得及确认消息就崩溃了。

4.6 其他消费者重新消费未确认消息

当 consumer1 崩溃后，Redis 会将 consumer1 未确认的消息重新放回 PEL 中。此时，我们可以启动另一个消费者 consumer2 来重新消费这些消息。

# 配置
stream_name = 'my_stream'
group_name = 'my_group'
consumer_name = 'consumer2' # 另一个消费者

# 循环消费消息
consume_message(group_name, consumer_name, stream_name)

consumer2 启动后，会从 PEL 中读取 consumer1 未确认的消息，并进行处理和确认。

通过这个例子，我们可以看到 XREADGROUP 和 ACK 机制如何保证消息的可靠性。即使消费者崩溃，消息也不会丢失，而是会被其他消费者重新消费。

第五章：总结与展望

好啦，今天的 Redis Streams 之旅就到这里告一段落了。我们一起探索了 XREAD 和 XREADGROUP 的用法、优势和局限性，还深入了解了 ACK 机制的重要性。

简单总结一下：

特性	`XREAD`	`XREADGROUP`
并发	低	高
可靠性	低，消息可能丢失	高，通过 ACK 机制保证消息不丢失
复杂度	简单	复杂，需要创建消费者组和手动 ACK
适用场景	小规模、低并发场景，快速原型验证	高并发、对消息可靠性要求高的场景

Redis Streams 是一个强大的消息队列，它提供了灵活的消息消费方式和可靠的消息保证。XREAD 和 XREADGROUP 是 Redis Streams 中最重要的两个命令，掌握它们，你就可以在你的项目中构建出高效、可靠的消息队列系统。

未来，Redis Streams 还有很多值得探索的地方，例如：

Stream 的持久化: 如何配置 Redis 将 Stream 的数据持久化到磁盘，以防止数据丢失。
Stream 的监控: 如何监控 Stream 的消费情况，及时发现和解决问题。
Stream 的应用场景: 如何将 Stream 应用到更广泛的场景中，例如实时数据分析、事件驱动架构等。

希望今天的分享能给你带来一些启发，让你对 Redis Streams 有更深入的了解。下次再见！👋

第一章：单人漂流记：XREAD 的自由与限制

1.1 XREAD 的基本用法：简单直接，拿来就用

1.2 XREAD 的优势：灵活，简单，适合个人项目

1.3 XREAD 的局限性：并发不高，消息丢失风险

第二章：组团出海：XREADGROUP 的力量与责任