如何使用`Docker`和`Kubernetes`容器化`Python`应用，并进行`自动`部署。 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

好的，让我们开始吧。

各位听众，今天我们来探讨如何使用 Docker 和 Kubernetes 容器化 Python 应用，并实现自动化部署。这是一个非常实用的技能，可以极大地提高开发效率、应用的可移植性和可扩展性。

一、Docker 镜像构建：容器化的基石

容器化的第一步是构建 Docker 镜像。Docker 镜像是一个轻量级的、可执行的软件包，包含了运行你的 Python 应用所需的一切：代码、运行时环境、系统工具、库和依赖项。

项目结构

首先，我们需要一个清晰的项目结构。假设我们有一个简单的 Flask 应用：

my_app/
├── app.py
├── requirements.txt
└── Dockerfile

app.py: 你的 Flask 应用代码。
requirements.txt: 应用依赖的 Python 包。
Dockerfile: 构建 Docker 镜像的指令文件。

Flask 应用 (app.py)

一个简单的 Flask 应用如下：

from flask import Flask

app = Flask(__name__)

@app.route('/')
def hello_world():
    return 'Hello, World!'

if __name__ == '__main__':
    app.run(debug=True, host='0.0.0.0')

依赖项 (requirements.txt)

使用 pip freeze > requirements.txt 生成依赖项文件。例如：

Flask==2.3.2
Werkzeug==2.3.6
...

Dockerfile

Dockerfile 是构建 Docker 镜像的核心。下面是一个示例：

# 使用官方 Python 3.9 镜像作为基础镜像
FROM python:3.9-slim-buster

# 设置工作目录
WORKDIR /app

# 将 requirements.txt 复制到工作目录
COPY requirements.txt .

# 安装依赖项
RUN pip install --no-cache-dir -r requirements.txt

# 将应用代码复制到工作目录
COPY . .

# 设置环境变量 (可选)
ENV FLASK_APP=app.py
ENV FLASK_ENV=development

# 暴露端口
EXPOSE 5000

# 定义启动命令
CMD ["flask", "run", "--host=0.0.0.0"]

FROM: 指定基础镜像。 python:3.9-slim-buster 是一个精简的 Python 3.9 镜像，减少了镜像体积。
WORKDIR: 设置工作目录，后续命令都将在该目录下执行。
COPY: 将文件从宿主机复制到镜像中。
RUN: 执行命令，例如安装依赖项。 --no-cache-dir 禁用 pip 的缓存，减少镜像体积。
ENV: 设置环境变量。 FLASK_APP 指定 Flask 应用的文件名， FLASK_ENV 设置 Flask 运行环境。
EXPOSE: 声明容器监听的端口。但这并不意味着容器会发布到宿主机的端口，需要在运行容器时进行端口映射。
CMD: 定义容器启动时执行的命令。

构建镜像

在包含 Dockerfile 的目录下，运行以下命令构建镜像：

docker build -t my-python-app:latest .

docker build: 构建镜像的命令。
-t my-python-app:latest: 为镜像打标签。 my-python-app 是镜像名称， latest 是标签。
.: 指定 Dockerfile 所在的目录。

运行容器

构建完成后，运行容器：

docker run -d -p 5000:5000 my-python-app:latest

docker run: 运行容器的命令。
-d: 以 detached 模式运行容器 (后台运行)。
-p 5000:5000: 将宿主机的 5000 端口映射到容器的 5000 端口。

现在，你应该可以通过浏览器访问 http://localhost:5000 看到 "Hello, World!"。

二、Kubernetes 部署：应用编排的利器

Kubernetes 是一个容器编排平台，用于自动化部署、扩展和管理容器化应用。

Kubernetes 概念

Pod: Kubernetes 中最小的可部署单元，包含一个或多个容器。
Deployment: 用于声明式地管理 Pod 的期望状态，例如副本数量、更新策略。
Service: 为 Pod 提供稳定的网络访问入口，可以实现负载均衡。

Deployment YAML 文件

创建一个 deployment.yaml 文件，定义 Deployment：

apiVersion: apps/v1
kind: Deployment
metadata:
  name: my-python-app-deployment
spec:
  replicas: 3  # 期望运行 3 个副本
  selector:
    matchLabels:
      app: my-python-app
  template:
    metadata:
      labels:
        app: my-python-app
    spec:
      containers:
      - name: my-python-app-container
        image: my-python-app:latest  # 使用之前构建的镜像
        ports:
        - containerPort: 5000

apiVersion: 指定 Kubernetes API 版本。
kind: 指定资源类型，这里是 Deployment。
metadata.name: Deployment 的名称。
spec.replicas: 期望运行的 Pod 副本数量。
spec.selector.matchLabels: 用于选择属于该 Deployment 的 Pod。
spec.template.metadata.labels: Pod 的标签，需要与 selector 匹配。
spec.template.spec.containers: Pod 中包含的容器定义。
spec.template.spec.containers.image: 容器使用的镜像。
spec.template.spec.containers.ports: 容器暴露的端口。

Service YAML 文件

创建一个 service.yaml 文件，定义 Service：

apiVersion: v1
kind: Service
metadata:
  name: my-python-app-service
spec:
  selector:
    app: my-python-app  # 选择带有 app=my-python-app 标签的 Pod
  ports:
  - protocol: TCP
    port: 80  # Service 的端口
    targetPort: 5000  # Pod 的端口
  type: LoadBalancer  # 使用 LoadBalancer 类型

apiVersion: 指定 Kubernetes API 版本。
kind: 指定资源类型，这里是 Service。
metadata.name: Service 的名称。
spec.selector: 用于选择 Service 后端的 Pod。
spec.ports.port: Service 的端口，外部访问该端口。
spec.ports.targetPort: Pod 的端口，Service 将流量转发到该端口。
spec.type: Service 类型。 LoadBalancer 类型会在云平台上创建一个负载均衡器，将流量转发到 Service。如果你的 Kubernetes 集群运行在本地，可以使用 NodePort 类型。

部署应用

使用 kubectl 命令部署应用：

kubectl apply -f deployment.yaml
kubectl apply -f service.yaml

kubectl apply: 将 YAML 文件定义的资源应用到 Kubernetes 集群。
-f: 指定 YAML 文件。

验证部署

查看 Deployment 和 Service 的状态：

kubectl get deployments
kubectl get services

如果 Service 类型是 LoadBalancer，等待云平台分配外部 IP 地址。如果是 NodePort，可以通过节点的 IP 地址和 NodePort 访问应用。

三、自动化部署：CI/CD 的集成

为了实现自动化部署，我们需要将 Docker 镜像构建和 Kubernetes 部署集成到 CI/CD (持续集成/持续交付) 流程中。常用的 CI/CD 工具包括 Jenkins、GitLab CI、GitHub Actions 等。

这里以 GitHub Actions 为例进行说明。

GitHub Actions Workflow 文件

在你的项目根目录下创建一个 .github/workflows/deploy.yml 文件：

name: Deploy to Kubernetes

on:
  push:
    branches: [ main ]  # 当 push 到 main 分支时触发

jobs:
  build:
    runs-on: ubuntu-latest

    steps:
    - uses: actions/checkout@v3
    - name: Set up Python 3.9
      uses: actions/setup-python@v4
      with:
        python-version: 3.9
    - name: Install dependencies
      run: |
        python -m pip install --upgrade pip
        pip install -r requirements.txt
    - name: Build Docker image
      run: docker build -t my-python-app:latest .
    - name: Log in to Docker Hub
      run: docker login -u ${{ secrets.DOCKERHUB_USERNAME }} -p ${{ secrets.DOCKERHUB_PASSWORD }}
    - name: Push Docker image
      run: docker push my-python-app:latest

  deploy:
    needs: build
    runs-on: ubuntu-latest
    steps:
    - name: Checkout code
      uses: actions/checkout@v3
    - name: Set up kubectl
      uses: azure/setup-kubectl@v3
      with:
        version: 'v1.25.0' #kubernetes version
    - name: Configure Kubernetes credentials
      run: |
        echo "${{ secrets.K8S_CONFIG }}" | base64 -d > k8s_config.yaml
        export KUBECONFIG=$(pwd)/k8s_config.yaml
    - name: Deploy to Kubernetes
      run: |
        kubectl apply -f deployment.yaml
        kubectl apply -f service.yaml

name: Workflow 的名称。
on.push.branches: 触发 Workflow 的分支。
jobs.build: 构建 Docker 镜像的 Job。
- runs-on: 运行 Job 的环境。
- steps: Job 中包含的步骤。
  - actions/checkout@v3: 检出代码。
  - actions/setup-python@v4: 设置 Python 环境。
  - pip install -r requirements.txt: 安装依赖项。
  - docker build: 构建 Docker 镜像。
  - docker login: 登录 Docker Hub (或者其他镜像仓库)。需要将 Docker Hub 用户名和密码存储在 GitHub Secrets 中。
  - docker push: 推送 Docker 镜像到 Docker Hub。
jobs.deploy: 部署到 Kubernetes 的 Job。
- needs: 指定该 Job 依赖的 Job (必须在 build Job 完成后才能运行)。
- azure/setup-kubectl@v3: 设置 kubectl。
- Configure Kubernetes credentials: 配置 Kubernetes 凭据。需要将 Kubernetes 配置文件存储在 GitHub Secrets 中，并将其解码为 k8s_config.yaml 文件。
- kubectl apply: 部署应用到 Kubernetes。

配置 GitHub Secrets

在 GitHub 仓库的 Settings -> Secrets -> Actions 中添加以下 Secrets：

DOCKERHUB_USERNAME: Docker Hub 用户名。
DOCKERHUB_PASSWORD: Docker Hub 密码。
K8S_CONFIG: Kubernetes 配置文件 (base64 编码)。

触发部署

当向 main 分支推送代码时，GitHub Actions 会自动构建 Docker 镜像，并将其推送到 Docker Hub，然后部署到 Kubernetes。

四、总结与思考

我们了解了如何使用 Docker 容器化 Python 应用，并使用 Kubernetes 进行部署。通过集成 CI/CD 工具，可以实现自动化部署，提高开发效率。

以下表格对比了 Docker 和 Kubernetes 的主要功能：

功能	Docker	Kubernetes
主要作用	容器化应用	容器编排、管理
核心概念	镜像、容器	Pod、Deployment、Service
解决的问题	应用环境一致性、依赖管理	应用部署、扩展、负载均衡、滚动更新、自愈
自动化程度	较低	较高
适用场景	单机应用、简单的多容器应用	大规模分布式应用

一些思考：

镜像安全: 需要定期扫描镜像，查找潜在的安全漏洞。
资源管理: 合理配置 Kubernetes 的资源限制，防止资源浪费或资源不足。
监控与日志: 集成监控和日志系统，以便及时发现和解决问题。
服务发现: 可以使用 Kubernetes 的 Service Discovery 机制，简化服务之间的调用。

持续学习，不断实践

容器化和 Kubernetes 是复杂的技术，需要不断学习和实践才能掌握。希望今天的分享能帮助你入门。后续可以深入研究 Kubernetes 的高级特性，例如 Helm、Ingress、RBAC 等，以满足更复杂的需求。

发表回复 取消回复

发表回复取消回复