JAVA Netty 粘包拆包？基于 LengthFieldBasedFrameDecoder 的规范处理 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

Netty 粘包拆包问题及 LengthFieldBasedFrameDecoder 规范处理

大家好，今天我们来聊聊 Netty 中一个非常重要且常见的概念：粘包拆包，以及如何使用 LengthFieldBasedFrameDecoder 来规范地处理这个问题。

什么是粘包拆包？

在 TCP 协议中，数据是以字节流的形式传输的，并没有明确的消息边界。这就可能导致以下两种情况：

粘包 (Packet Combining): 多个应用层数据包被 TCP 协议组合成一个 TCP 包发送。
拆包 (Packet Splitting): 一个应用层数据包被 TCP 协议拆分成多个 TCP 包发送。

举个例子：

假设客户端连续发送两个数据包：

包 1: "Hello" (5 字节)
包 2: "World" (5 字节)

在理想情况下，服务端应该接收到两个独立的包。但是，由于网络拥塞、缓冲区大小等因素的影响，可能会出现以下情况：

粘包： 服务端一次性接收到 "HelloWorld" (10 字节)。
拆包： 服务端先接收到 "Hel"，然后接收到 "loWorld"。
粘包 + 拆包： 服务端先接收到 "Hel"，然后接收到 "loWor"，最后接收到 "ld"。

为什么会出现粘包拆包？

这是 TCP 协议本身的特性决定的。TCP 是一种面向流的协议，它不保证消息的完整性，只保证数据的可靠传输。具体来说，以下因素会导致粘包拆包：

TCP Nagle 算法： 为了提高网络利用率，Nagle 算法会将小的 TCP 包合并成大的 TCP 包发送。
TCP 缓冲区大小： TCP 协议在发送端和接收端都有缓冲区。发送端会将数据写入缓冲区，然后由 TCP 协议发送。接收端接收到数据后，也会先将数据写入缓冲区，然后由应用程序读取。如果缓冲区大小不足以容纳一个完整的数据包，就会发生拆包。
网络拥塞： 当网络拥塞时，TCP 协议会进行流量控制，可能会将一个大的数据包拆分成多个小的 TCP 包发送。

粘包拆包带来的问题

如果不对粘包拆包进行处理，会导致应用程序无法正确解析数据。例如，在上面的例子中，如果服务端一次性接收到 "HelloWorld"，它可能会误以为这是一个完整的数据包，从而导致程序逻辑错误。

解决粘包拆包的常用方法

为了解决粘包拆包问题，通常有以下几种方法：

固定长度消息 (Fixed-Length Message): 每个消息的长度固定，接收方每次读取固定长度的数据。这种方式简单，但灵活性较差。
特殊分隔符 (Delimiter-Based Framing): 在每个消息的末尾添加特殊的分隔符，接收方通过分隔符来识别消息边界。例如，可以使用换行符 n 或 rn 作为分隔符。
长度字段 (Length-Field-Based Framing): 在消息头部添加一个长度字段，用于标识消息的长度。接收方先读取长度字段，然后根据长度字段读取完整的消息。
自定义协议 (Custom Protocol): 根据实际需求，自定义协议格式，包括消息头、消息体等。

LengthFieldBasedFrameDecoder 原理及使用

LengthFieldBasedFrameDecoder 是 Netty 提供的一个非常强大的解码器，它基于长度字段来解决粘包拆包问题。它支持多种长度字段的配置，可以灵活地适应不同的协议格式。

LengthFieldBasedFrameDecoder 的构造函数参数：

public LengthFieldBasedFrameDecoder(
    int maxFrameLength,
    int lengthFieldOffset,
    int lengthFieldLength,
    int lengthAdjustment,
    int initialBytesToStrip)

参数含义：

maxFrameLength: 最大帧长度。如果接收到的帧长度超过该值，将会抛出 TooLongFrameException。
lengthFieldOffset: 长度字段的偏移量。指的是长度字段在整个帧中的起始位置（从 0 开始计算）。
lengthFieldLength: 长度字段的长度。指的是长度字段占用的字节数。
lengthAdjustment: 长度调节值。指的是在获取到长度字段的值后，需要再加上的偏移量，才能得到真正的内容的起始位置。例如，长度字段的值不包含长度字段本身的长度，那么 lengthAdjustment 就需要设置为 lengthFieldLength。
initialBytesToStrip: 跳过的字节数。指的是在解码后，需要跳过的字节数。通常用于跳过长度字段，只保留内容部分。

工作原理：

LengthFieldBasedFrameDecoder 会先读取 lengthFieldOffset 指定的偏移量，然后读取 lengthFieldLength 指定长度的字节，将其转换为一个整数，作为消息的长度。
然后，它会根据 lengthAdjustment 对长度进行调整，得到内容部分的起始位置。
接着，它会读取指定长度的内容，并根据 initialBytesToStrip 跳过指定的字节数，最终将解码后的消息传递给下一个 Handler。

示例：

假设我们定义了一种简单的协议格式：

消息总长度 (4 字节, int 类型)
消息内容 (可变长度)

例如，一个完整的消息可能是：

[0x00, 0x00, 0x00, 0x0A, 0x48, 0x65, 0x6c, 0x6c, 0x6f, 0x57, 0x6f, 0x72, 0x6c, 0x64]

其中，0x00, 0x00, 0x00, 0x0A 表示消息总长度为 10 字节，0x48, 0x65, 0x6c, 0x6c, 0x6f, 0x57, 0x6f, 0x72, 0x6c, 0x64 表示消息内容为 "HelloWorld"。

我们可以使用 LengthFieldBasedFrameDecoder 来解码这种消息：

import io.netty.buffer.ByteBuf;
import io.netty.channel.ChannelHandlerContext;
import io.netty.handler.codec.LengthFieldBasedFrameDecoder;

public class MyDecoder extends LengthFieldBasedFrameDecoder {

    private static final int MAX_FRAME_LENGTH = 1024;
    private static final int LENGTH_FIELD_OFFSET = 0;
    private static final int LENGTH_FIELD_LENGTH = 4;
    private static final int LENGTH_ADJUSTMENT = 0;
    private static final int INITIAL_BYTES_TO_STRIP = 0;

    public MyDecoder() {
        super(MAX_FRAME_LENGTH, LENGTH_FIELD_OFFSET, LENGTH_FIELD_LENGTH, LENGTH_ADJUSTMENT, INITIAL_BYTES_TO_STRIP);
    }

    @Override
    protected Object decode(ChannelHandlerContext ctx, ByteBuf in) throws Exception {
        ByteBuf frame = (ByteBuf) super.decode(ctx, in);
        if (frame == null) {
            return null; // 说明数据包还不完整
        }

        // 在这里可以对解码后的数据进行处理
        byte[] data = new byte[frame.readableBytes()];
        frame.readBytes(data);
        frame.release(); // 释放ByteBuf

        String message = new String(data);
        System.out.println("Received message: " + message);
        return message;
    }
}

代码解释：

MAX_FRAME_LENGTH: 设置最大帧长度为 1024 字节。
LENGTH_FIELD_OFFSET: 设置长度字段的偏移量为 0，表示长度字段从消息的起始位置开始。
LENGTH_FIELD_LENGTH: 设置长度字段的长度为 4 字节。
LENGTH_ADJUSTMENT: 设置长度调节值为 0，因为长度字段的值已经包含了消息内容和长度字段本身的长度。
INITIAL_BYTES_TO_STRIP: 设置跳过的字节数为 0，因为我们希望保留长度字段。
decode 方法中，首先调用父类的 decode 方法进行解码，如果返回 null，说明数据包还不完整，需要等待更多的数据。如果返回一个 ByteBuf，说明解码成功，可以从 ByteBuf 中读取数据并进行处理。

客户端编码器：

为了配合上面的解码器，我们需要一个客户端编码器，将消息编码成符合协议格式的字节流。

import io.netty.buffer.ByteBuf;
import io.netty.buffer.Unpooled;
import io.netty.channel.ChannelHandlerContext;
import io.netty.handler.codec.MessageToByteEncoder;

public class MyEncoder extends MessageToByteEncoder<String> {

    @Override
    protected void encode(ChannelHandlerContext ctx, String msg, ByteBuf out) throws Exception {
        byte[] data = msg.getBytes();
        int length = data.length;

        // 写入消息总长度
        out.writeInt(length);

        // 写入消息内容
        out.writeBytes(data);
    }
}

代码解释：

encode 方法将字符串消息编码成字节流。
首先，获取消息内容的字节数组，并计算消息长度。
然后，将消息长度写入 ByteBuf 中，使用 writeInt 方法写入一个 4 字节的整数。
最后，将消息内容写入 ByteBuf 中，使用 writeBytes 方法写入字节数组。

在 ChannelPipeline 中使用：

import io.netty.channel.ChannelInitializer;
import io.netty.channel.ChannelPipeline;
import io.netty.channel.socket.SocketChannel;

public class MyChannelInitializer extends ChannelInitializer<SocketChannel> {

    @Override
    protected void initChannel(SocketChannel ch) throws Exception {
        ChannelPipeline pipeline = ch.pipeline();
        pipeline.addLast("decoder", new MyDecoder());
        pipeline.addLast("encoder", new MyEncoder());
        pipeline.addLast("handler", new MyHandler());
    }
}

代码解释：

在 ChannelPipeline 中，首先添加 MyDecoder 解码器，用于解码接收到的数据。
然后，添加 MyEncoder 编码器，用于编码发送的数据。
最后，添加 MyHandler 处理器，用于处理解码后的消息。

更复杂的例子：

假设我们的协议格式更复杂一些：

魔数 (2 字节, short 类型)
版本号 (1 字节, byte 类型)
消息类型 (1 字节, byte 类型)
消息体长度 (4 字节, int 类型)
消息体 (可变长度)

例如：

[0x12, 0x34, 0x01, 0x02, 0x00, 0x00, 0x00, 0x05, 0x48, 0x65, 0x6c, 0x6c, 0x6f]

其中：

0x12, 0x34：魔数
0x01：版本号
0x02：消息类型
0x00, 0x00, 0x00, 0x05：消息体长度为 5
0x48, 0x65, 0x6c, 0x6c, 0x6f：消息体 "Hello"

在这种情况下，我们需要修改 LengthFieldBasedFrameDecoder 的参数：

import io.netty.buffer.ByteBuf;
import io.netty.channel.ChannelHandlerContext;
import io.netty.handler.codec.LengthFieldBasedFrameDecoder;

public class ComplexDecoder extends LengthFieldBasedFrameDecoder {

    private static final int MAX_FRAME_LENGTH = 1024;
    private static final int LENGTH_FIELD_OFFSET = 4; // 消息体长度字段的偏移量
    private static final int LENGTH_FIELD_LENGTH = 4; // 消息体长度字段的长度
    private static final int LENGTH_ADJUSTMENT = 8; // 长度调整值，需要加上魔数、版本号、消息类型、消息体长度的长度
    private static final int INITIAL_BYTES_TO_STRIP = 8; // 跳过的字节数，跳过魔数、版本号、消息类型、消息体长度

    public ComplexDecoder() {
        super(MAX_FRAME_LENGTH, LENGTH_FIELD_OFFSET, LENGTH_FIELD_LENGTH, LENGTH_ADJUSTMENT, INITIAL_BYTES_TO_STRIP);
    }

    @Override
    protected Object decode(ChannelHandlerContext ctx, ByteBuf in) throws Exception {
        ByteBuf frame = (ByteBuf) super.decode(ctx, in);
        if (frame == null) {
            return null;
        }

        // 在这里可以对解码后的数据进行处理，例如读取魔数、版本号、消息类型等
        // 示例：
        // short magic = frame.readShort();
        // byte version = frame.readByte();
        // byte messageType = frame.readByte();

        byte[] data = new byte[frame.readableBytes()];
        frame.readBytes(data);
        frame.release();

        String message = new String(data);
        System.out.println("Received message: " + message);
        return message;
    }
}

修改说明：

LENGTH_FIELD_OFFSET: 设置为 4，因为消息体长度字段的偏移量是从魔数、版本号、消息类型之后开始的。
LENGTH_FIELD_LENGTH: 设置为 4，因为消息体长度字段的长度为 4 字节。
LENGTH_ADJUSTMENT: 设置为 8，因为长度字段的值只是消息体的长度，我们需要加上魔数、版本号、消息类型、消息体长度的长度 (2 + 1 + 1 + 4 = 8) 才能得到完整消息的长度。
INITIAL_BYTES_TO_STRIP: 设置为 8，因为我们需要跳过魔数、版本号、消息类型、消息体长度，只保留消息体。

总结：

参数	含义	示例
`maxFrameLength`	最大帧长度，超过该长度会抛出异常。	1024
`lengthFieldOffset`	长度字段在帧中的起始位置（从 0 开始计算）。	0 (长度字段在最前面), 4 (长度字段在魔数、版本号等信息之后)
`lengthFieldLength`	长度字段占用的字节数。	4 (int), 2 (short), 1 (byte)
`lengthAdjustment`	长度调节值，用于计算内容部分的起始位置。通常需要考虑长度字段本身是否包含在长度值中。	0 (长度字段已包含整个消息长度), `lengthFieldLength` (长度字段不包含自身长度), 8 (包含魔数版本号等固定头长度)
`initialBytesToStrip`	解码后需要跳过的字节数，通常用于跳过长度字段，只保留内容部分。	0 (保留所有字节), 4 (跳过长度字段), 8 (跳过魔数版本号等固定头)

避免常见错误，更好地使用 LengthFieldBasedFrameDecoder

计算错误： 最常见的错误是 lengthAdjustment 和 initialBytesToStrip 计算错误。务必仔细分析协议格式，确保计算正确。
maxFrameLength 设置过小： 如果 maxFrameLength 设置过小，会导致正常的消息被截断，抛出 TooLongFrameException。
数据类型不匹配： 长度字段的数据类型必须与实际的长度值匹配。例如，如果长度字段是 int 类型，但实际长度值超过了 int 类型的最大值，会导致解码错误。
缓冲区不足： 在解码过程中，如果缓冲区不足以容纳完整的消息，会导致解码失败。

优雅地处理粘包拆包

LengthFieldBasedFrameDecoder 提供了一种规范且灵活的方式来处理粘包拆包问题。通过合理地配置参数，我们可以轻松地适应各种复杂的协议格式。掌握 LengthFieldBasedFrameDecoder 的原理和使用方法对于开发高性能、高可靠性的 Netty 应用至关重要。理解了核心概念，能够更加有效地构建基于 Netty 的网络应用程序。

Netty 粘包拆包问题及 LengthFieldBasedFrameDecoder 规范处理

什么是粘包拆包？

粘包拆包带来的问题

解决粘包拆包的常用方法

LengthFieldBasedFrameDecoder 原理及使用

避免常见错误，更好地使用 LengthFieldBasedFrameDecoder

优雅地处理粘包拆包

发表回复 取消回复

发表回复取消回复