Kubernetes HPA 结合自定义指标实现更智能伸缩 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

Kubernetes HPA：让你的应用像弹簧一样伸缩自如，还要够聪明！😎

各位观众老爷们，大家好！我是你们的老朋友，一个在代码的海洋里摸爬滚打多年的老水手。今天，咱们不聊风花雪月，不谈人生理想，就来聊聊Kubernetes里一个非常实用，但又常常被大家忽略的功能——Horizontal Pod Autoscaler (HPA)，也就是水平Pod自动伸缩。

想象一下，你家的小餐馆，平时生意冷清，三五个顾客稀稀拉拉。但到了周末，人山人海，座位都快不够用了。如果餐馆老板每次都要手动增加桌椅，那得累死个人！同样的道理，咱们的应用也一样，流量高峰期需要更多资源，低谷期又浪费资源。HPA就像一个勤劳的管家，它能根据应用的负载情况，自动调整Pod的数量，让你的应用像弹簧一样，伸缩自如！

但是！传统的HPA，往往只能根据CPU、内存等指标进行伸缩，这就像只看体重来判断一个人是否健康一样，太片面了！有时候，CPU使用率不高，但应用却已经开始卡顿了，这时候就需要自定义指标来拯救世界了！

今天，我们就来深入探讨一下，如何将Kubernetes HPA与自定义指标相结合，打造一个真正智能化的伸缩方案，让你的应用不仅能扛住流量高峰，还能优雅地省钱！💰

一、HPA：你的应用需要一个智能管家

首先，让我们来复习一下HPA的基本概念。

什么是HPA？

HPA全称Horizontal Pod Autoscaler，顾名思义，就是水平Pod自动伸缩器。它会根据一定的策略，自动调整Deployment、ReplicaSet等控制器所管理的Pod副本数量。

HPA的工作原理？

HPA会定期（默认30秒）从Metrics Server或其他指标源获取指标数据，然后与目标值进行比较，根据算法计算出需要的Pod副本数量，并通知控制器进行调整。

可以用一个简单的公式来表示：

所需副本数 = ceil(当前副本数 * (当前指标值 / 目标指标值))

举个例子，假设当前有2个Pod，目标CPU使用率为50%，当前CPU使用率为80%，那么：

所需副本数 = ceil(2 * (80% / 50%)) = ceil(3.2) = 4

HPA就会将Pod数量调整为4个。

HPA的优点？

自动伸缩，节省资源： 根据负载自动调整Pod数量，避免资源浪费。
提高可用性： 在流量高峰期，自动增加Pod数量，保证应用的稳定运行。
简化运维： 减少手动干预，降低运维成本。

HPA的局限性？

只能根据有限的指标进行伸缩： 默认只能根据CPU和内存进行伸缩，对于一些特殊应用，这些指标可能无法准确反映负载情况。
伸缩策略不够灵活： 默认的伸缩策略比较简单，无法满足一些复杂的场景需求。
依赖Metrics Server： 需要安装和配置Metrics Server，增加了部署和维护的复杂度。

二、自定义指标：让HPA拥有更敏锐的感知力

想象一下，你的应用是一个电商网站，CPU和内存使用率都很低，但是数据库的连接数却已经满了，导致用户无法下单。这时候，即使HPA没有增加Pod数量，你的应用也已经崩溃了！

这时候，就需要自定义指标来发挥作用了！

什么是自定义指标？

自定义指标是指除了CPU和内存之外的其他指标，例如：

请求延迟： 应用处理请求的平均时间。
队列长度： 待处理的任务队列的长度。
数据库连接数： 应用与数据库建立的连接数量。
活跃用户数： 当前在线的用户数量。

这些指标更能反映应用的实际负载情况。

如何使用自定义指标？

使用自定义指标，需要以下几个步骤：

暴露指标： 应用需要将自定义指标暴露出来，可以使用Prometheus等监控系统。
配置Metrics Server： 配置Metrics Server，使其能够从Prometheus等监控系统获取自定义指标。
创建HPA： 创建HPA，指定使用自定义指标作为伸缩的依据。

举个例子：

假设我们有一个Web应用，需要根据请求延迟进行伸缩。

暴露指标： 在应用中，使用Prometheus client library暴露请求延迟指标：

from prometheus_client import Summary, start_http_server
import random
import time

REQUEST_LATENCY = Summary('request_latency_seconds', 'Request latency in seconds')

@REQUEST_LATENCY.time()
def process_request():
    """A dummy function that takes some time."""
    time.sleep(random.random())

if __name__ == '__main__':
    # Start up the server to expose the metrics.
    start_http_server(8000)
    # Generate some requests.
    while True:
        process_request()

配置Metrics Server： 安装Prometheus，并配置Metrics Server，使其能够从Prometheus获取request_latency_seconds_sum和request_latency_seconds_count指标。

创建HPA： 创建HPA，指定使用request_latency_seconds_sum和request_latency_seconds_count指标计算平均请求延迟，并将其作为伸缩的依据：

apiVersion: autoscaling/v2beta2
kind: HorizontalPodAutoscaler
metadata:
  name: my-web-app
spec:
  scaleTargetRef:
    apiVersion: apps/v1
    kind: Deployment
    name: my-web-app
  minReplicas: 1
  maxReplicas: 10
  metrics:
  - type: Pods
    pods:
      metric:
        name: request_latency_seconds
      target:
        type: AverageValue
        averageValue: 0.1 # 目标平均请求延迟为0.1秒

这个HPA会根据Pod的平均请求延迟，自动调整my-web-app Deployment的Pod数量，使其保持在1到10个之间，并且平均请求延迟接近0.1秒。

三、HPA结合自定义指标：打造更智能的伸缩方案

现在，我们已经了解了HPA和自定义指标的基本概念，接下来，我们将探讨如何将它们结合起来，打造一个更智能的伸缩方案。

1. 选择合适的指标：

选择合适的指标是至关重要的。不同的应用需要选择不同的指标。例如，对于Web应用，可以选择请求延迟、QPS等指标；对于数据库应用，可以选择数据库连接数、查询延迟等指标。

应用类型	常用指标
Web应用	请求延迟、QPS、活跃用户数
数据库应用	数据库连接数、查询延迟、事务处理时间
消息队列	队列长度、消息处理速度、积压消息数量
流处理应用	处理速度、数据延迟、资源利用率（CPU、内存、磁盘I/O）

2. 指标聚合方式：

HPA支持多种指标聚合方式，例如：

AverageValue： 计算所有Pod的平均值。
AverageUtilization： 计算所有Pod的平均利用率。
Value： 使用单个Pod的指标值。

选择合适的聚合方式，可以更准确地反映应用的负载情况。例如，对于请求延迟，可以使用AverageValue；对于CPU利用率，可以使用AverageUtilization。

3. 伸缩策略：

HPA支持多种伸缩策略，例如：

HorizontalPodAutoscalerBehavior： 可以自定义伸缩行为，例如设置伸缩的冷却时间、伸缩的幅度等。

behavior:
  scaleUp:
    stabilizationWindowSeconds: 300 # 伸缩冷却时间为300秒
    policies:
    - type: Percent
      value: 10
      periodSeconds: 60 # 每60秒最多增加10%的Pod
  scaleDown:
    stabilizationWindowSeconds: 300
    policies:
    - type: Percent
      value: 10
      periodSeconds: 60 # 每60秒最多减少10%的Pod

4. 多指标伸缩：

HPA支持多指标伸缩，可以根据多个指标的值，综合判断应用的负载情况，并进行伸缩。

metrics:
- type: Resource
  resource:
    name: cpu
    target:
      type: Utilization
      averageUtilization: 50
- type: Pods
  pods:
    metric:
      name: request_latency_seconds
    target:
      type: AverageValue
      averageValue: 0.1

这个HPA会同时根据CPU利用率和请求延迟进行伸缩，只有当CPU利用率超过50%或者请求延迟超过0.1秒时，才会增加Pod数量。

5. 使用External Metrics：

除了Pod metrics，HPA还支持使用External Metrics，例如：

来自云厂商的指标： 例如，AWS CloudWatch、Azure Monitor、Google Cloud Monitoring等。
来自第三方监控系统的指标： 例如，Datadog、New Relic、Dynatrace等。

使用External Metrics，可以更全面地了解应用的运行状况，并进行更智能的伸缩。

四、实战演练：用自定义指标优化电商应用的HPA

假设我们有一个电商应用，用户访问量不稳定，高峰期集中在促销活动期间。为了保证应用的稳定性和可用性，我们需要使用HPA进行自动伸缩。

但是，仅仅根据CPU和内存进行伸缩是不够的，因为用户下单时，需要访问数据库，如果数据库连接数满了，即使CPU和内存使用率不高，用户也无法下单。

因此，我们需要使用自定义指标——数据库连接数，来优化HPA的伸缩策略。

步骤：

暴露数据库连接数指标： 在应用中，使用Prometheus client library暴露数据库连接数指标：

from prometheus_client import Gauge, start_http_server
import time
import random

DB_CONNECTIONS = Gauge('db_connections', 'Number of database connections')

def get_db_connections():
    """A dummy function that returns the number of database connections."""
    return random.randint(0, 100)

if __name__ == '__main__':
    # Start up the server to expose the metrics.
    start_http_server(8000)
    # Generate some database connections.
    while True:
        DB_CONNECTIONS.set(get_db_connections())
        time.sleep(1)

配置Metrics Server： 安装Prometheus，并配置Metrics Server，使其能够从Prometheus获取db_connections指标。

创建HPA： 创建HPA，指定使用db_connections指标作为伸缩的依据：

apiVersion: autoscaling/v2beta2
kind: HorizontalPodAutoscaler
metadata:
  name: my-ecommerce-app
spec:
  scaleTargetRef:
    apiVersion: apps/v1
    kind: Deployment
    name: my-ecommerce-app
  minReplicas: 1
  maxReplicas: 10
  metrics:
  - type: Resource
    resource:
      name: cpu
      target:
        type: Utilization
        averageUtilization: 70
  - type: Pods
    pods:
      metric:
        name: db_connections
      target:
        type: AverageValue
        averageValue: 50 # 目标平均数据库连接数为50

这个HPA会同时根据CPU利用率和数据库连接数进行伸缩。只有当CPU利用率超过70%或者平均数据库连接数超过50时，才会增加Pod数量。

效果：

通过使用自定义指标，我们可以更准确地反映电商应用的负载情况，并进行更智能的伸缩。在流量高峰期，即使CPU利用率不高，但如果数据库连接数满了，HPA也会自动增加Pod数量，从而保证用户可以正常下单。

五、总结：HPA + 自定义指标 = 智能伸缩，高效省钱！

各位观众老爷们，今天我们深入探讨了Kubernetes HPA与自定义指标的结合，希望大家能够掌握以下几个要点：

HPA是Kubernetes中实现自动伸缩的重要工具。
自定义指标可以弥补HPA的局限性，让HPA拥有更敏锐的感知力。
选择合适的指标、聚合方式和伸缩策略，可以打造一个更智能的伸缩方案。
实战演练可以帮助你更好地理解HPA和自定义指标的应用。

总而言之，HPA结合自定义指标，就像给你的应用装上了一个智能大脑，让它能够根据实际情况，自动调整资源，既保证了应用的稳定性和可用性，又节省了资源，可谓是一举两得！👍

希望这篇文章能够帮助大家更好地理解和应用Kubernetes HPA，让你的应用像弹簧一样，伸缩自如，并且足够聪明！感谢大家的观看！我们下次再见！ 👋