Docker restart policy：控制容器重启行为 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

好的，各位观众老爷，各位技术大咖，以及各位正在努力爬坑的萌新们，今天咱们要聊点啥呢？就聊聊Docker容器的“起死回生术”——重启策略(Restart Policy)。

想象一下，你的容器就像一只精心饲养的小宠物，你希望它能稳定运行，为你提供服务。但现实往往是残酷的，小宠物偶尔会闹脾气（崩溃、退出），这时候，你总不能每次都手动去把它唤醒吧？太费劲了！

所以，Docker为我们准备了“重启策略”这个神器，让你的容器具备“浴火重生”的能力，自动处理一些“小意外”，省时省力，简直是运维界的福音！

咱们先来一段开胃菜，用生动的比喻聊聊重启策略的作用：

no (不重启): 就像一只佛系小乌龟，一旦挂了，就彻底不动了，除非你手动把它扶起来。适合那些“一次性”任务，比如跑个脚本就结束的容器。
on-failure (失败时重启): 就像一只生命力顽强的小强，只有在“非正常死亡”（退出码非0）的时候才会挣扎着爬起来。适合那些对稳定性有一定要求，但允许偶尔“抽风”的容器。
always (总是重启): 就像一只打了鸡血的永动机，除非你手动停止它，否则它会永远尝试运行，即使是Docker守护进程重启了，它也会跟着复活。适合那些核心服务，比如数据库、Web服务器，必须保证高可用性。
unless-stopped (除非手动停止): 就像一只乖巧听话的小绵羊，只要你没明确告诉它“休息”，它就会一直勤勤恳恳地工作。即使Docker守护进程重启了，它也会跟着复活。但如果你手动停止了它，它就会乖乖地躺在那里，直到你再次启动它。适合那些需要手动控制生命周期的容器。

是不是感觉一下子就明白了？接下来，咱们深入了解一下这些策略的细节和使用场景。

一、 Docker重启策略的详细解读

咱们先用一张表格，把这些策略的特点总结一下：

重启策略	行为描述	适用场景	注意事项
`no`	容器退出后，不会自动重启。	一次性任务，例如：数据迁移脚本、测试脚本等。	适用于不需要自动重启的容器。
`on-failure[:max-retries]`	容器退出码非0时，才会自动重启。`max-retries` 可选参数，指定最大重启次数。如果未指定，则无限制重启。	容错性要求不高，允许偶尔出错，但希望自动恢复的服务。例如：后台任务处理服务、不重要的API服务等。	需要根据实际情况设置 `max-retries` 参数，避免无限循环重启。如果容器频繁崩溃，应该优先排查容器内部的问题，而不是依赖重启策略。`max-retries` 的值会影响 Docker 守护进程的资源消耗。
`always`	容器退出后，总是自动重启。即使Docker守护进程重启，容器也会自动重启。	高可用性要求的核心服务。例如：数据库、Web服务器、缓存服务等。	容器如果一直无法正常启动，会导致无限循环重启，消耗系统资源。需要配合健康检查(Health Check)机制，确保容器只有在健康状态下才提供服务。容器的健康检查结果会影响 Docker 守护进程对容器的重启行为。
`unless-stopped`	容器退出后，总是自动重启。即使Docker守护进程重启，容器也会自动重启。但如果容器被手动停止，则不会自动重启，直到手动启动。	需要手动控制生命周期的服务。例如：开发环境中的服务、需要定期维护的服务等。	手动停止的容器不会自动重启，需要注意与 `always` 策略的区别。适用于需要灵活控制容器生命周期的场景。

1. no (不重启)

这是最简单粗暴的策略。容器一旦退出，就彻底凉凉了，除非你亲自出手，docker start 把它唤醒。

使用场景：

跑完就走的脚本容器：比如，你用容器执行一个数据备份脚本，跑完就结束了，不需要自动重启。
临时测试容器：你想快速测试一个镜像，跑完就删，不需要关心它是否自动重启。

例子：

docker run --rm --name my-test-container -d alpine sleep 5
# 容器运行5秒后自动退出，不会自动重启

2. on-failure[:max-retries] (失败时重启)

这个策略就稍微智能一些了。它会监控容器的退出码。如果退出码是0，表示容器正常结束，那就啥也不干，让它安安静静地躺在那里。但如果退出码不是0，表示容器发生了错误，它就会尝试重启。

[:max-retries] 是一个可选参数，用来限制最大重启次数。如果你不指定，默认是无限重启，直到天荒地老。但为了防止容器陷入无限重启的死循环，最好还是设置一个合理的 max-retries 值。

使用场景：

容错性要求不高的后台任务：比如，一个图片处理服务，偶尔出错也没关系，重启一下就好。
不重要的API服务：比如，一个提供天气信息的API，挂了影响不大，重启一下就行。

例子：

docker run --restart on-failure:3 --name my-api-container -d my-api-image
# 容器如果退出码非0，最多重启3次

注意事项：

一定要根据实际情况设置 max-retries，避免无限循环重启。
如果容器频繁崩溃，应该优先排查容器内部的问题，而不是依赖重启策略。重启策略只是一个“创可贴”，不能解决根本问题。
max-retries 的值会影响 Docker 守护进程的资源消耗。如果设置得太大，可能会导致系统资源紧张。

3. always (总是重启)

这个策略是最激进的，也是最常用的。只要容器退出，它就会毫不犹豫地重启，不管是因为什么原因。即使Docker守护进程重启了，它也会跟着复活，就像一只打不死的小强！

使用场景：

核心服务：比如，数据库、Web服务器、消息队列等，必须保证高可用性。
任何你希望永远运行的容器：比如，监控服务、日志收集服务等。

例子：

docker run --restart always --name my-db-container -d my-db-image
# 容器总是自动重启

注意事项：

容器如果一直无法正常启动，会导致无限循环重启，消耗系统资源。
需要配合健康检查(Health Check)机制，确保容器只有在健康状态下才提供服务。否则，即使容器内部已经崩溃，Docker仍然会认为它是健康的，继续重启，导致服务一直不可用。
容器的健康检查结果会影响 Docker 守护进程对容器的重启行为。如果容器的健康检查失败，Docker可能会暂停重启，或者采取其他措施。

4. unless-stopped (除非手动停止)

这个策略是 always 的一个变种。它和 always 的区别在于：如果你手动停止了容器，它就不会自动重启了，除非你再次手动启动它。

使用场景：

开发环境中的服务：比如，你在开发一个Web应用，需要频繁地启动和停止容器，但又希望在Docker守护进程重启后，容器能自动恢复。
需要定期维护的服务：比如，你需要定期更新一个缓存服务，更新完成后，手动启动它。

例子：

docker run --restart unless-stopped --name my-cache-container -d my-cache-image
# 容器总是自动重启，除非手动停止

注意事项：

手动停止的容器不会自动重启，需要注意与 always 策略的区别。
适用于需要灵活控制容器生命周期的场景。

二、如何设置重启策略

设置重启策略有两种方式：

在 docker run 命令中使用 --restart 参数:

这是最常用的方式，简单直接。
```
docker run --restart <restart_policy> <image_name>
```
例如：
```
docker run --restart always -d nginx:latest
```
在 docker-compose.yml 文件中使用 restart 字段:

如果你使用 Docker Compose 来管理容器，可以在 docker-compose.yml 文件中设置重启策略。
```
version: "3.9"
services:
  web:
    image: nginx:latest
    restart: always
    ports:
      - "80:80"
```

三、健康检查 (Health Check) 与重启策略的完美结合

重启策略虽然可以自动恢复容器，但它并不能保证容器提供的服务是正常的。比如，一个Web服务器容器虽然还在运行，但由于内部程序错误，已经无法处理请求了。这时候，重启策略仍然会认为容器是健康的，继续让它运行，导致服务一直不可用。

为了解决这个问题，我们需要配合健康检查机制。健康检查可以让Docker定期检查容器的健康状态，只有在容器健康时，才认为它可以正常提供服务。如果容器的健康检查失败，Docker可以自动重启容器，或者采取其他措施，比如停止容器，发送告警等。

如何进行健康检查呢？

在Dockerfile中使用 HEALTHCHECK 指令:

在Dockerfile中添加 HEALTHCHECK 指令，可以定义容器的健康检查逻辑。
```
FROM nginx:latest

HEALTHCHECK --interval=5s --timeout=3s --retries=3 CMD curl -f http://localhost/ || exit 1
```
这个例子中，我们使用 curl 命令来检查Web服务器是否正常响应。如果 curl 命令返回非0退出码，表示健康检查失败。
- --interval=5s: 每隔5秒进行一次健康检查。
- --timeout=3s: 健康检查的超时时间为3秒。
- --retries=3: 如果健康检查失败，最多重试3次。

在 docker-compose.yml 文件中使用 healthcheck 字段:

version: "3.9"
services:
  web:
    image: nginx:latest
    restart: always
    ports:
      - "80:80"
    healthcheck:
      test: ["CMD", "curl", "-f", "http://localhost/"]
      interval: 5s
      timeout: 3s
      retries: 3

健康检查和重启策略是如何配合工作的呢？

Docker会定期执行容器的健康检查。
如果健康检查成功，Docker认为容器是健康的，继续让它运行。
如果健康检查失败，Docker会根据重启策略来决定是否重启容器。
- 如果重启策略是 no，Docker不会重启容器。
- 如果重启策略是 on-failure，Docker会重启容器。
- 如果重启策略是 always 或 unless-stopped，Docker会立即重启容器。

四、最佳实践

根据实际需求选择合适的重启策略:

不同的应用场景需要不同的重启策略。不要盲目地使用 always 策略，要根据实际情况选择最合适的策略。
设置合理的 max-retries 值:

如果使用 on-failure 策略，一定要设置一个合理的 max-retries 值，避免无限循环重启。
配合健康检查机制:

使用健康检查机制，确保容器只有在健康状态下才提供服务。
监控容器的运行状态:

使用监控工具，监控容器的运行状态，及时发现和解决问题。
合理配置Liveness和Readiness探测
在Kubernetes等容器编排系统中，Liveness探测用于判断容器是否“活着”，如果探测失败，K8s会重启容器；Readiness探测用于判断容器是否准备好接收流量，如果探测失败，K8s会将容器从服务中移除。合理配置这两种探测，可以更精细地控制容器的生命周期，避免服务中断。

五、总结

Docker重启策略是一个非常实用的功能，可以帮助我们提高容器的可用性和稳定性。但要真正发挥重启策略的作用，需要根据实际情况选择合适的策略，配合健康检查机制，并进行有效的监控。

希望这篇文章能够帮助你更好地理解和使用Docker重启策略。祝你在Docker的世界里玩得开心！ 😉

发表回复 取消回复

发表回复取消回复