Redis 内存碎片化：产生原因、检测与整理优化 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

各位好，今天咱们来聊聊 Redis 的内存碎片化，这玩意儿就像你家里的抽屉，东西放久了，乱七八糟，空间利用率直线下降。Redis 也一样，用的时间长了，内存也会变得支离破碎，影响性能。别怕，今天咱们就来把这个“抽屉”好好整理整理。

一、啥是内存碎片化？你家抽屉乱了，就是这玩意儿！

想象一下，你往 Redis 里塞数据，就像往抽屉里放东西。刚开始，抽屉空空的，放啥都方便，一块连续的空间给你放个“衣服”，再放个“裤子”。但当你删除一些数据（比如“旧袜子”），就会留下一些空隙。这些空隙可能太小，放不下新的完整的数据（比如“新鞋”），这就造成了内存碎片。

简单来说，内存碎片就是：

外部碎片： 很多小块的空闲内存，加起来够用，但因为不连续，没法分配给需要大块连续内存的请求。就像你抽屉里有很多小空隙，但放不下一双鞋。
内部碎片： 分配给你的内存块，你实际上用不了那么多，浪费了。就像你抽屉里有个专门放鞋的格子，你只放了双袜子，剩下的空间就浪费了。

在 Redis 中，我们主要关注的是外部碎片，因为它对性能影响更大。

二、为啥会有碎片？Redis 也没闲着啊！

Redis 用的是动态内存分配，也就是需要的时候才申请，不用的时候释放。这本身没问题，但频繁的分配和释放就容易产生碎片。

频繁的分配与释放： 这是罪魁祸首！你不停地 SET、DEL 数据，Redis 就在不停地申请和释放内存。
对象大小不一： Redis 存储的数据类型很多，String、List、Hash 等等，大小各异。删除小的对象后，留下的空隙可能放不下更大的对象。
内存分配器： Redis 默认使用 jemalloc 作为内存分配器。jemalloc 在分配内存时，为了效率，可能会有一些预留空间，也会造成一定程度的碎片。
Copy-on-Write (COW)： 在 Redis 的持久化过程中，如果数据集很大，COW 机制会复制一部分内存。频繁的写入操作会导致频繁的复制，也可能产生碎片。

三、咋知道 Redis 碎了没？别瞎猜，看指标！

Redis 提供了一些命令来查看内存碎片信息，咱们用 INFO Memory 命令：

redis-cli info memory

输出结果里，关注以下几个关键指标：

指标名称	含义	重要程度
`used_memory`	Redis 已经使用的总内存大小 (单位：字节)。	高
`used_memory_rss`	Redis 进程实际占用的物理内存大小 (Resident Set Size，单位：字节)。包括了 Redis 进程使用的所有内存，例如代码段、堆、栈、共享库以及直接内存映射等。	高
`used_memory_peak`	Redis 内存使用的峰值 (单位：字节)。	中
`used_memory_lua`	Lua 引擎使用的内存 (单位：字节)。	低
`mem_fragmentation_ratio`	内存碎片率，`used_memory_rss / used_memory`。这个值大于 1 说明存在内存碎片，越大说明碎片越严重。例如，`mem_fragmentation_ratio` 为 1.5，意味着进程实际占用的物理内存是 Redis 逻辑内存的 1.5 倍，额外的 0.5 倍就是碎片。小于 1 说明使用了 swap，性能会急剧下降。	高
`mem_allocator`	Redis 使用的内存分配器，通常是 `jemalloc`。	低

重点关注 mem_fragmentation_ratio！

mem_fragmentation_ratio > 1.5： 说明碎片比较严重，需要考虑进行碎片整理。
1 < mem_fragmentation_ratio < 1.5： 说明有一定程度的碎片，但可以接受。
mem_fragmentation_ratio < 1： 通常说明 Redis 正在使用 swap，性能会非常差，应该避免。

实战演练：

假设我们执行 INFO Memory 命令，得到以下结果：

# Memory
used_memory:1048576
used_memory_rss:1572864
used_memory_peak:1258291
used_memory_lua:0
mem_fragmentation_ratio:1.5
mem_allocator:jemalloc-5.1.0

mem_fragmentation_ratio 是 1.5，说明有比较严重的内存碎片。

四、怎么拯救 Redis 的“抽屉”？碎片整理大法！

Redis 提供了几种方法来整理内存碎片：

MEMORY PURGE 命令（Redis 4.0 及以上）：

这是 Redis 提供的一个显式的碎片整理命令。它会尝试对内存进行整理，释放一些不必要的内存。
```
redis-cli memory purge
```
这个命令执行期间会阻塞 Redis，所以建议在低峰期执行。

注意： MEMORY PURGE 只是尽力而为，不保证完全消除碎片。它主要依赖于底层的内存分配器（比如 jemalloc）的能力。
重启 Redis 实例：

这是最简单粗暴的方法！重启后，Redis 会重新申请内存，碎片自然就消失了。但缺点也很明显：会造成服务中断。

优雅重启： 可以使用 Redis 的 RDB 或 AOF 持久化机制，先将数据保存到磁盘，然后重启 Redis，再从磁盘恢复数据。这样可以尽量减少服务中断的时间。
升级 jemalloc 版本：

jemalloc 的新版本通常会包含一些内存管理方面的优化，可以减少碎片产生的可能性。升级 jemalloc 需要重新编译 Redis，比较麻烦，但可以带来长期的收益。
数据迁移：

如果碎片非常严重，且无法通过其他方式解决，可以考虑将数据迁移到新的 Redis 实例。这相当于重新整理了“抽屉”，把有用的东西搬到新家，旧的就扔了。

数据迁移工具： 可以使用 redis-cli --migrate 命令或者第三方工具 (比如 redis-shake) 来进行数据迁移。

代码示例：使用 redis-cli --migrate 命令进行数据迁移

假设我们要将数据从源 Redis 实例 (192.168.1.100:6379) 迁移到目标 Redis 实例 (192.168.1.101:6379)：

redis-cli --migrate 192.168.1.101 6379 "" 0 5000 COPY REPLACE

192.168.1.101: 目标 Redis 实例的 IP 地址。
6379: 目标 Redis 实例的端口号。
"": 要迁移的 key 的模式，"" 表示迁移所有 key。可以使用 * 等通配符。
0: 目标数据库的编号。
5000: 超时时间 (毫秒)。
COPY: 在迁移过程中，不删除源 Redis 实例中的 key。
REPLACE: 如果目标 Redis 实例中存在相同的 key，则覆盖。

五、防患于未然：减少碎片产生的秘诀

与其亡羊补牢，不如防患于未然。我们可以采取一些措施来减少碎片产生的可能性：

合理设置过期时间：

过期时间设置得太短，会导致频繁的删除操作，增加碎片产生的概率。合理设置过期时间，避免频繁的过期 key 删除。
避免频繁的写入大对象：

写入大对象更容易产生碎片。可以考虑将大对象拆分成多个小对象存储。
使用 Hash 数据结构：

Hash 数据结构可以将多个小字段存储在一个 key 中，减少 key 的数量，降低碎片产生的概率。
定期监控碎片率：

定期使用 INFO Memory 命令查看 mem_fragmentation_ratio，及时发现并处理碎片问题。
控制键值对的生命周期:
- 避免短生命周期的键值对: 频繁创建和删除键值对是导致内存碎片的主要原因之一。尽量延长键值对的生命周期，减少创建和删除操作。
- 使用Hash数据结构: 将多个相关的小对象存储在一个Hash结构中，减少键的数量，从而降低碎片产生的风险。
优化数据结构和访问模式:
- 选择合适的数据结构: 根据实际需求选择最适合的数据结构。例如，如果需要存储大量小字符串，可以考虑使用String数据结构的压缩功能或将它们存储在Hash结构中。
- 避免频繁的APPEND操作: 对String类型进行频繁的APPEND操作会导致内存重新分配，增加碎片。可以使用预分配空间或将数据存储在List或Set结构中。
- 避免一次性读取大量数据: 分批次读取数据可以减少内存占用，降低碎片产生的可能性。

六、各种碎片整理方法的优缺点

方法	优点	缺点	适用场景
`MEMORY PURGE`	简单易用，无需重启 Redis	执行期间会阻塞 Redis，效果有限，不保证完全消除碎片	碎片程度较轻，且可以容忍短暂阻塞的场景
重启 Redis 实例	效果最好，可以彻底消除碎片	会造成服务中断，需要考虑数据持久化和恢复	碎片非常严重，且可以容忍服务中断的场景
升级 jemalloc	长期收益，可以减少碎片产生的可能性	需要重新编译 Redis，比较麻烦	对性能要求较高，且愿意承担一定升级风险的场景
数据迁移	可以彻底消除碎片，且可以实现 Redis 集群的扩容	比较复杂，需要考虑数据一致性和迁移时间	碎片非常严重，且需要进行 Redis 集群扩容的场景

七、一些实际场景的例子

电商网站的 Session 管理：

如果 Session 的过期时间设置得太短，且用户量很大，会导致频繁的 Session 创建和删除，产生大量碎片。可以适当延长 Session 的过期时间，或者使用其他 Session 管理方案 (比如 Redis Cluster)。
排行榜应用：

如果排行榜的数据更新非常频繁，会导致频繁的写入操作，产生碎片。可以考虑使用 Sorted Set 数据结构，并对数据进行批量更新。
缓存系统：

如果缓存的数据量很大，且缓存的 key 的大小不一，容易产生碎片。可以考虑对缓存的数据进行压缩，或者使用 Hash 数据结构来存储缓存数据。

八、总结：

内存碎片化是 Redis 运行过程中不可避免的问题，但我们可以通过一些方法来减少碎片产生的可能性，并及时进行碎片整理。记住，监控 mem_fragmentation_ratio，定期整理“抽屉”，才能让 Redis 跑得更快更稳！

希望今天的分享对大家有所帮助！谢谢！

发表回复 取消回复

发表回复取消回复