PHP-FPM的Readiness/Liveness Probe配置：确保服务在K8s中的优雅启停

大家好，今天我们来聊聊如何在Kubernetes (K8s) 环境下优雅地运行PHP-FPM，并且通过配置Readiness和Liveness Probe来确保服务的健康状态和可靠性。PHP-FPM作为一个高性能的PHP进程管理器，在Web应用中扮演着重要的角色。在K8s中，合理配置Probe可以帮助我们实现自动化的健康检查、故障恢复以及灰度发布等功能，提升整体应用的稳定性和弹性。

1. 什么是Readiness Probe 和 Liveness Probe?

在深入PHP-FPM的配置之前，我们先来明确一下Readiness Probe和Liveness Probe的概念。它们都是Kubernetes提供的健康检查机制，但作用略有不同：

Liveness Probe (存活探针): 用于检测容器是否仍然存活。如果Liveness Probe检测失败，Kubernetes将会重启容器。可以理解为“这个容器还能不能正常工作？如果不能，就重启一下”。
Readiness Probe (就绪探针): 用于检测容器是否已经准备好接收流量。如果Readiness Probe检测失败，Kubernetes会将容器从Service的endpoints列表中移除，这意味着不会有新的流量路由到这个容器。可以理解为“这个容器准备好接受请求了吗？如果还没准备好，就先别让它处理请求”。

2. 为什么需要配置Probe？

在没有配置Probe的情况下，Kubernetes默认认为容器启动后就一直处于健康状态，即使容器内部发生了错误或者应用没有完全启动，Kubernetes也不会采取任何措施。这会导致以下问题：

流量被路由到不健康的容器: 用户可能会访问到未完全启动或者已经崩溃的容器，导致请求失败。
无法自动恢复: 如果容器内部出现问题，Kubernetes无法自动重启容器进行修复，需要人工干预。
灰度发布风险: 在灰度发布过程中，如果新版本容器启动失败，流量可能会被路由到这些不健康的容器，影响用户体验。

通过配置Readiness和Liveness Probe，我们可以让Kubernetes更加智能地管理容器的生命周期，及时发现并处理问题，从而提高应用的可用性和稳定性。

3. PHP-FPM Probe 的实现方式

针对PHP-FPM，我们可以使用多种方式来实现Readiness和Liveness Probe。常见的有以下几种：

HTTP Probe: 通过发送HTTP请求到PHP-FPM管理的Web服务器（如Nginx或Apache）的特定URL，并检查返回的HTTP状态码。
TCP Probe: 尝试建立TCP连接到PHP-FPM监听的端口。
Exec Probe: 在容器内部执行一个命令，并检查命令的退出状态码。

在实际应用中，HTTP Probe是最常用的方式，因为它能够更准确地反映应用的健康状态。例如，我们可以创建一个专门的健康检查接口，该接口会检查数据库连接、缓存状态等关键依赖项，并返回相应的HTTP状态码。

4. HTTP Probe 的配置示例

下面是一个使用HTTP Probe的Kubernetes Deployment配置示例：

apiVersion: apps/v1
kind: Deployment
metadata:
  name: php-fpm-deployment
spec:
  replicas: 3
  selector:
    matchLabels:
      app: php-fpm
  template:
    metadata:
      labels:
        app: php-fpm
    spec:
      containers:
      - name: php-fpm
        image: your-php-fpm-image:latest
        ports:
        - containerPort: 9000
        readinessProbe:
          httpGet:
            path: /healthz
            port: 80
          initialDelaySeconds: 5
          periodSeconds: 10
          timeoutSeconds: 5
          successThreshold: 1
          failureThreshold: 3
        livenessProbe:
          httpGet:
            path: /healthz
            port: 80
          initialDelaySeconds: 15
          periodSeconds: 10
          timeoutSeconds: 5
          successThreshold: 1
          failureThreshold: 3

这个配置中，我们定义了一个名为php-fpm-deployment的Deployment，它包含3个副本。readinessProbe和livenessProbe都使用了HTTP GET请求来检查容器的健康状态。

path: /healthz，表示请求的URL路径。我们需要在Web服务器上配置一个路由，将该路径映射到PHP-FPM的健康检查脚本。
port: 80，表示请求的端口号。这是Web服务器（如Nginx）监听的端口。
initialDelaySeconds: 5 和 15，分别表示容器启动后，Readiness Probe和Liveness Probe首次执行的延迟时间，单位为秒。设置延迟时间是为了给应用足够的启动时间。
periodSeconds: 10，表示Probe执行的间隔时间，单位为秒。
timeoutSeconds: 5，表示Probe执行的超时时间，单位为秒。
successThreshold: 1，表示Probe至少需要成功多少次才被认为是健康的。
failureThreshold: 3，表示Probe最多可以失败多少次才被认为是Unhealthy的。

5. 健康检查脚本的实现

接下来，我们需要在PHP-FPM中实现/healthz接口。一个简单的健康检查脚本可以如下所示：

<?php

// 检查数据库连接
try {
    $pdo = new PDO("mysql:host=your_db_host;dbname=your_db_name", "your_db_user", "your_db_password");
    $pdo->setAttribute(PDO::ATTR_ERRMODE, PDO::ERRMODE_EXCEPTION);
    $pdo = null; // 关闭连接
} catch (PDOException $e) {
    http_response_code(500); // 数据库连接失败
    echo "Database connection failed: " . $e->getMessage();
    exit;
}

// 检查Redis连接 (如果使用)
if (extension_loaded('redis')) {
    try {
        $redis = new Redis();
        $redis->connect('your_redis_host', 6379);
        $redis->ping();
        $redis->close();
    } catch (Exception $e) {
        http_response_code(500); // Redis连接失败
        echo "Redis connection failed: " . $e->getMessage();
        exit;
    }
}

http_response_code(200); // 一切正常
echo "OK";
exit;

这个脚本会检查数据库和Redis连接（如果使用了Redis）。如果任何一个连接失败，它会返回HTTP状态码500，否则返回200。需要注意的是，需要根据实际情况修改数据库和Redis的连接参数。

6. Nginx 配置示例

为了将/healthz请求路由到PHP-FPM，我们需要在Nginx配置中添加相应的location配置：

server {
    listen 80;
    server_name your_domain.com;

    root /var/www/html;
    index index.php index.html index.htm;

    location / {
        try_files $uri $uri/ /index.php?$query_string;
    }

    location ~ .php$ {
        include snippets/fastcgi-php.conf;
        fastcgi_pass unix:/run/php/php7.4-fpm.sock; # 根据你的PHP-FPM版本修改
    }

    location /healthz {
        access_log off;  # 禁止记录健康检查请求
        return 200 "OK"; # 可以直接返回OK，也可以代理到PHP-FPM执行健康检查脚本
        # 如果需要代理到PHP-FPM，可以使用以下配置：
        # fastcgi_pass unix:/run/php/php7.4-fpm.sock;
        # include snippets/fastcgi-php.conf;
    }

    location ~ /.ht {
        deny all;
    }
}

在这个配置中，我们添加了一个/healthz的location块。为了降低健康检查对性能的影响，建议禁用/healthz请求的访问日志。可以直接返回状态码200，或者代理到PHP-FPM执行健康检查脚本。如果选择代理到PHP-FPM，需要确保PHP-FPM能够正确处理/healthz请求，并返回相应的HTTP状态码。

7. TCP Probe 和 Exec Probe 的配置

除了HTTP Probe，我们还可以使用TCP Probe和Exec Probe来检查PHP-FPM的健康状态。

TCP Probe: 尝试建立TCP连接到PHP-FPM监听的9000端口。如果连接成功，则认为容器是健康的。

readinessProbe:
  tcpSocket:
    port: 9000
  initialDelaySeconds: 5
  periodSeconds: 10
  timeoutSeconds: 5
  successThreshold: 1
  failureThreshold: 3
livenessProbe:
  tcpSocket:
    port: 9000
  initialDelaySeconds: 15
  periodSeconds: 10
  timeoutSeconds: 5
  successThreshold: 1
  failureThreshold: 3

Exec Probe: 在容器内部执行一个命令，并检查命令的退出状态码。例如，可以执行php-fpm -t命令来检查PHP-FPM的配置文件是否有效。

readinessProbe:
  exec:
    command: ["php-fpm", "-t"]
  initialDelaySeconds: 5
  periodSeconds: 10
  timeoutSeconds: 5
  successThreshold: 1
  failureThreshold: 3
livenessProbe:
  exec:
    command: ["php-fpm", "-t"]
  initialDelaySeconds: 15
  periodSeconds: 10
  timeoutSeconds: 5
  successThreshold: 1
  failureThreshold: 3

8. Probe 参数调优

合理设置Probe的参数对于应用的稳定性和性能至关重要。以下是一些常见的调优建议：

initialDelaySeconds: 设置合适的延迟时间，给应用足够的启动时间。如果应用启动时间较长，可以适当增加延迟时间。
periodSeconds: 设置合理的检查间隔时间。如果检查频率过高，会增加服务器的负载；如果检查频率过低，可能无法及时发现问题。
timeoutSeconds: 设置合理的超时时间。如果超时时间过短，可能会导致误判；如果超时时间过长，会增加故障恢复的时间。
failureThreshold: 设置合适的失败次数阈值。如果阈值过低，可能会导致频繁重启；如果阈值过高，可能无法及时发现问题。
successThreshold: 对于Readiness Probe，可以适当增加成功次数阈值，确保容器已经完全准备好接收流量。

9. 如何测试Probe配置

在部署应用之前，建议先对Probe配置进行测试，以确保其能够正常工作。可以使用以下方法进行测试：

手动测试: 通过手动访问/healthz接口，检查返回的HTTP状态码是否正确。
模拟故障: 模拟数据库连接失败、Redis连接失败等故障，观察Kubernetes是否能够正确地重启容器。
使用kubectl describe pod命令: 查看Pod的事件日志，确认Probe是否在正常工作，以及是否存在任何错误信息。

10. Readiness vs. Liveness: 选择合适的策略

虽然Readiness和Liveness Probe都用于健康检查，但它们的应用场景略有不同。

Liveness Probe: 主要用于检测容器是否已经崩溃或者无法正常工作。对于PHP-FPM来说，如果PHP-FPM进程崩溃或者无法响应请求，Liveness Probe会检测到并重启容器。
Readiness Probe: 主要用于检测容器是否已经准备好接收流量。对于PHP-FPM来说，如果PHP-FPM正在启动、正在加载配置或者正在进行维护，Readiness Probe会检测到并将其从Service的endpoints列表中移除，避免流量被路由到未准备好的容器。

一般来说，Liveness Probe应该尽可能简单，只检查容器是否存活即可。Readiness Probe可以更加复杂，检查应用的各种依赖项是否正常。

11. 最佳实践

健康检查脚本应该尽可能轻量级: 避免在健康检查脚本中执行过于复杂的逻辑，以免增加服务器的负载。
健康检查脚本应该覆盖关键依赖项: 确保健康检查脚本能够检查应用的关键依赖项，如数据库连接、Redis连接、缓存状态等。
使用不同的Probe进行不同级别的健康检查: 可以使用Liveness Probe检查容器是否存活，使用Readiness Probe检查应用是否准备好接收流量。
监控Probe的执行结果: 通过监控Probe的执行结果，可以及时发现并处理问题。

12. 优雅停机处理

除了配置Readiness和Liveness Probe，我们还需要关注PHP-FPM的优雅停机处理。当Kubernetes需要停止或者重启容器时，它会先发送一个SIGTERM信号给容器内的进程。我们需要确保PHP-FPM能够正确地处理SIGTERM信号，并在停止之前完成正在处理的请求，避免数据丢失或者请求失败。

PHP-FPM本身支持优雅停机。当接收到SIGTERM信号时，PHP-FPM会停止接受新的请求，并等待所有正在处理的请求完成。

为了确保优雅停机，我们需要注意以下几点：

设置合适的terminationGracePeriodSeconds: 在Deployment配置中，可以设置terminationGracePeriodSeconds参数，指定Kubernetes等待容器停止的最大时间。

spec:
  template:
    spec:
      terminationGracePeriodSeconds: 30 # 单位为秒
      containers:
      - name: php-fpm
        image: your-php-fpm-image:latest

处理SIGTERM信号: 可以在PHP-FPM的配置文件中添加相应的配置，处理SIGTERM信号。
避免长时间运行的请求: 尽量避免在PHP-FPM中执行长时间运行的请求，以免影响优雅停机的速度。

一些思考和总结

配置PHP-FPM的Readiness和Liveness Probe是在Kubernetes环境下运行PHP应用的关键步骤。通过合理配置Probe，我们可以确保应用的健康状态，实现自动化的故障恢复，并提高应用的可用性和稳定性。在实际应用中，需要根据应用的具体情况选择合适的Probe类型和参数，并进行充分的测试。优雅停机处理是保证服务稳定性的另一重要方面，务必进行相应的配置。务必根据应用的实际情况和依赖关系，定制化健康检查脚本。

PHP-FPM的Readiness/Liveness Probe配置：确保服务在K8s中的优雅启停

发表回复 取消回复

发表回复取消回复