什么是 ‘Semantic Versioning for Prompts’？如何通过 Git 流程管理提示词的变更与生产回滚 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

提示词的语义化版本控制与 Git 工作流：构建稳健的 AI 应用

各位同仁，大家好。

随着人工智能技术的飞速发展，特别是大型语言模型（LLMs）的普及，提示词（Prompts）已经不再是简单的文本输入，它们正在演变为我们与AI交互的核心接口，是驱动AI应用逻辑的关键“代码”。提示词的质量、一致性和可维护性，直接关系到AI应用的性能、稳定性和用户体验。

然而，我们经常看到团队在提示词管理上陷入困境：

变更难以追踪： 不知道哪个版本的提示词导致了线上问题。
协作效率低下： 多人修改提示词，互相覆盖，导致混乱。
生产回滚困难： 新提示词上线后效果不佳，却无法快速恢复到旧版本。
环境差异复杂： 开发、测试、生产环境的提示词版本不一致。

这些问题，与传统软件开发中遇到的挑战如出一辙。幸运的是，软件工程领域经过数十年发展，已经形成了一套成熟的解决方案：版本控制和发布管理。今天，我们将深入探讨如何将这些宝贵的实践——特别是语义化版本控制 (Semantic Versioning) 和 Git 工作流——应用于提示词的管理，从而构建更健壮、更可控的AI应用。

一、提示词的语义化版本控制 (Semantic Versioning for Prompts)

在传统软件开发中，语义化版本控制（SemVer）是一个被广泛接受的规范，格式为 MAJOR.MINOR.PATCH。它提供了一种清晰的方式来传达版本之间的兼容性和变更类型。当我们将提示词视为AI应用的“代码”或“配置”时，完全可以将SemVer的原则应用到提示词的版本管理上。

SemVer 格式：MAJOR.MINOR.PATCH

MAJOR 版本号 (主版本号)：当你对提示词做了不兼容的、破坏性的变更时，需要递增 MAJOR 版本号。这意味着使用旧版本提示词的应用，在不进行修改的情况下，无法正常或可靠地使用新版本提示词。
- 提示词场景示例：
  - 输出格式的根本性改变： 比如，将提示词的预期输出从纯文本强制改为特定的 JSON 结构，或者改变了 JSON 结构中的必填字段名称/类型。
  - 核心功能或意图的移除： 移除了某个旧版本提示词中承诺的关键功能或信息要求，导致依赖此功能下游逻辑中断。
  - API 级别的重大重构： 如果提示词被视为一个外部可调用的“AI API”，改变了其输入参数的含义、数量或必填性，导致调用方必须修改。
  - 模型行为的根本性改变： 提示词的改动导致模型在核心任务上的行为发生根本性、不可预期的变化，即使输出格式不变，但其内在逻辑已无法兼容旧的期望。
- 例子： v1.x.x -> v2.0.0
MINOR 版本号 (次版本号)：当你对提示词做了向后兼容的功能性新增或改进时，需要递增 MINOR 版本号。这意味着新版本提示词在保留旧功能的基础上，增加了新的能力或优化。
- 提示词场景示例：
  - 新增可选输入参数： 提示词现在支持一个可选的额外上下文信息，以提高性能或丰富输出，但不影响旧的用户输入。
  - 优化提示词措辞以提高准确性： 在不改变核心逻辑和输出格式的前提下，通过润色提示词，让模型生成更准确、更相关或更流畅的回答。
  - 增加新的指令或约束： 在不破坏现有输出格式的前提下，为模型增加新的指导，例如“请使用更礼貌的语气”或“请限制输出长度在500字以内”。
  - 新增支持场景： 提示词现在可以处理新的边缘情况，而不会影响其在核心场景下的表现。
- 例子： v1.0.x -> v1.1.0
PATCH 版本号 (修订号)：当你对提示词做了向后兼容的缺陷修复时，需要递增 PATCH 版本号。这通常是紧急修复或小幅优化，不会引入新功能，也不会破坏现有功能。
- 提示词场景示例：
  - 修正拼写错误或语法错误： 提示词文本中的错别字、标点错误或语法不通顺之处。
  - 微调措辞以消除歧义： 发现提示词中某个词语可能引起模型误解，进行细微调整，但不影响核心意图。
  - 减少 Token 消耗： 在不影响输出质量的前提下，精简提示词，降低调用成本。
  - 修复模型输出的偶发性小问题： 例如，模型偶尔会在输出中包含不必要的引导语，通过调整提示词来消除。
- 例子： v1.0.0 -> v1.0.1

预发布版本号和构建元数据 (Pre-release & Build Metadata)

预发布版本 (Pre-release Version)：在 MAJOR.MINOR.PATCH 之后，添加连字符和一系列以点分隔的标识符（例如 1.0.0-alpha.1，1.0.0-beta.2）。用于发布不稳定、可能不兼容的测试版本。在提示词场景中，这可以用于在内部测试环境中发布实验性的提示词版本。
构建元数据 (Build Metadata)：在 MAJOR.MINOR.PATCH 之后，添加加号和一系列以点分隔的标识符（例如 1.0.0+202310271530）。用于提供构建信息，不影响版本优先级。在提示词场景中，可以记录部署时间戳、Git Commit Hash 等。

SemVer 与提示词变更类型的对应表：

SemVer 部分	变更类型	提示词场景示例	兼容性
`MAJOR`	破坏性变更，与旧版本不兼容	输出格式强制变化、核心功能移除、API接口大改、模型行为根本性重构	不兼容
`MINOR`	向后兼容的功能新增或改进	新增可选参数、优化措辞提升准确性、增加新指令/约束、新增支持场景	兼容
`PATCH`	向后兼容的缺陷修复或小幅优化	修正拼写/语法错误、微调措辞消除歧义、降低 Token 消耗、修复偶发性输出小问题	兼容
`-alpha.x`	预发布版本，不稳定，可能不兼容	内部测试、实验性功能提示词	不确定
`+build.x`	构建元数据，不影响版本优先级	部署时间戳、Git Commit Hash	兼容

通过为提示词引入语义化版本控制，我们能够清晰地沟通每个版本带来的影响，并为后续的自动化部署、回滚和版本选择奠定基础。

二、Git 流程管理提示词变更的核心原则

Git 作为分布式版本控制系统，天然适合管理文本文件，而提示词本质上就是一种特殊的文本文件。将 Git 引入提示词管理，我们需要遵循以下核心原则：

提示词即代码 (Prompts-as-Code, PaC)：将提示词文件像源代码一样对待，存储在 Git 仓库中，享受代码所有管理优势：版本历史、分支、合并、审查。
单一事实来源 (Single Source of Truth)：Git 仓库是所有提示词的唯一、权威来源。任何对提示词的修改都必须通过 Git 流程进行。
协作与审查 (Collaboration & Review)：通过 Pull Request (PR) 或 Merge Request (MR) 机制，确保每个提示词变更都经过团队成员的审查，提高质量并减少错误。
自动化 (Automation)：利用 CI/CD（持续集成/持续部署）管道，自动化提示词的测试、验证和部署，减少人工干预，提高效率和可靠性。

三、提示词的 Git 仓库结构与文件格式

一个清晰、有组织的仓库结构对于提示词管理至关重要。

推荐的仓库结构：

我们可以根据应用、模块或功能来组织提示词文件。

prompts/
├── my_app_service_A/
│   ├── summarizer/
│   │   ├── v1/
│   │   │   ├── default_summary_prompt.json
│   │   │   └── long_summary_prompt.json
│   │   └── v2/
│   │       └── default_summary_prompt.json # v2版本可能简化了prompt结构或合并了功能
│   ├── entity_extractor/
│   │   ├── default_extractor_prompt.yaml
│   │   └── finance_entity_extractor_prompt.yaml
│   └── code_generator/
│       ├── python_function_generator_prompt.txt
│       └── java_class_generator_prompt.txt
└── common_utils/ # 可复用的通用提示词
    ├── sentiment_analysis_prompt.md
    └── rewrite_stylistic_prompt.json

文件格式选择：

选择合适的文件格式取决于提示词的复杂性和是否需要结构化数据。

JSON / YAML： 适合需要结构化参数、多个指令、输出格式要求等复杂提示词。易于程序解析和生成。

优点： 结构清晰、可读性好、易于版本控制 diff、支持注释（YAML）、易于与应用程序集成。
缺点： 对于纯文本指令而言略显冗余。

示例 (default_summary_prompt.json):

{
  "version": "1.0.0",
  "name": "Default Summary Prompt",
  "description": "Summarizes provided text into a concise overview.",
  "system_message": "You are a helpful assistant that summarizes text. Your goal is to extract the most important information and present it clearly and concisely.",
  "user_message_template": "Please summarize the following text:nn---n{{text_to_summarize}}n---nnFocus on the key points and keep the summary to a maximum of {{max_words}} words. Respond in {{output_language}}.",
  "parameters": {
    "text_to_summarize": {
      "type": "string",
      "required": true,
      "description": "The text content to be summarized."
    },
    "max_words": {
      "type": "integer",
      "required": false,
      "default": 100,
      "description": "The maximum number of words for the summary."
    },
    "output_language": {
      "type": "string",
      "required": false,
      "default": "English",
      "description": "The language of the output summary."
    }
  },
  "expected_output_format": "plain_text"
}

Markdown / 纯文本 (.txt)： 适合简单的指令、角色设定或长篇上下文。

优点： 简洁、直观、易于编写和阅读。
缺点： 缺乏结构化能力，参数管理不便。

示例 (python_function_generator_prompt.txt):

You are an expert Python programmer.
Your task is to generate a Python function based on the user's request.
The function should be well-commented, follow PEP8 guidelines, and include type hints.
Do not include any example usage or explanations, just the function code.

Request:
{{user_code_request}}

四、生产级 Git 分支策略：提示词的生命周期管理

为了有效管理提示词的开发、测试、发布和回滚，我们需要采用一个健壮的 Git 分支策略。这里我们以 Git Flow 或 GitHub Flow 的变体为例，结合提示词的特点进行说明。

1. main (或 master) 分支：

用途： 始终包含生产环境部署的稳定、已发布版本。
特点： 只接受 release 或 hotfix 分支的合并。直接提交到此分支是严格禁止的。
提示词场景： 生产环境中正在使用的提示词版本，通过 Git Tag 标记其 SemVer 版本号。

2. develop 分支：

用途： 集成所有新功能和改进的开发分支。作为下一个 release 的基础。
特点： 接收 feature 分支的合并。
提示词场景： 团队成员日常开发和测试新提示词功能或改进的基础。

3. feature/<feature-name> 分支：

用途： 用于开发新的提示词功能、进行重大重构或实现次要版本更新 (MINOR) 或主要版本更新 (MAJOR)。
创建： 从 develop 分支创建。
合并： 完成开发和测试后，通过 Pull Request 合并回 develop 分支。
命名示例： feature/add-json-output-to-summarizer, feature/refactor-code-generator-logic
提示词场景： 开发一个全新的摘要提示词，或者对现有摘要提示词进行重大修改，使其支持新的输出格式。

4. release/<version-number> 分支：

用途： 准备发布新版本。在此分支上进行最终测试、版本号更新（如果提示词文件内部包含版本字段）、bug 修复（PATCH 级别），并生成发布标签。
创建： 当 develop 分支达到发布状态时，从 develop 分支创建。
合并： 最终会合并回 main 和 develop 分支。合并到 main 时，会打上相应的 SemVer 标签。
命名示例： release/v1.1.0, release/v2.0.0
提示词场景： 准备将 develop 分支上已完成的一批提示词功能和修复发布到生产环境。

5. hotfix/<issue-description> 分支：

用途： 紧急修复生产环境中的关键缺陷。
创建： 从 main 分支创建。
合并： 修复完成后，会合并回 main 和 develop 分支。合并到 main 时，会打上新的 PATCH 级别 SemVer 标签。
命名示例： hotfix/fix-typo-in-summarizer-v1.0.1, hotfix/address-hallucination-in-extractor
提示词场景： 发现生产环境中的某个提示词存在严重的拼写错误，导致模型行为异常，需要紧急修复。

Git 分支策略概览表：

分支类型	目的	创建自	合并目标	提示词变更类型
`main`	生产环境稳定代码	N/A	N/A (只接受合并)	稳定发布的 MAJOR.MINOR.PATCH
`develop`	集成所有新功能，下一个发布的基础	`main`	N/A (接收 feature/hotfix)	进行中的 MAJOR/MINOR/PATCH 开发
`feature/<feature-name>`	开发新功能或重大改进	`develop`	`develop`	MAJOR/MINOR 变更的开发
`release/<version>`	发布准备，最终测试和版本标记	`develop`	`main`, `develop`	发布前的最终 PATCH 修复，MAJOR/MINOR 发布
`hotfix/<issue-name>`	紧急生产缺陷修复	`main`	`main`, `develop`	生产环境的 PATCH 修复

五、提示词变更的 Git 操作实践

让我们通过具体的 Git 命令来演示上述流程。

假设我们有一个名为 prompts-repo 的 Git 仓库，包含上述文件结构。

场景一：开发新功能 – 为摘要提示词添加语言选择功能 (MINOR 变更)

从 develop 分支创建 feature 分支：

git checkout develop
git pull origin develop # 确保本地develop分支最新
git checkout -b feature/add-language-option-to-summarizer

修改提示词文件：
打开 prompts/my_app_service_A/summarizer/v1/default_summary_prompt.json，在 parameters 中添加 output_language 字段，并在 user_message_template 中使用它。
（如前文 default_summary_prompt.json 示例所示）
提交变更 (使用 Conventional Commits 规范):
Conventional Commits 是一种结构化的提交消息规范，有助于自动化版本发布和生成变更日志。
- feat: (feature) 用于新功能。
- fix: (fix) 用于 bug 修复。
- chore: (chore) 用于日常任务。
- docs: (docs) 用于文档。
- style: (style) 用于代码样式。
- refactor: (refactor) 用于重构。
- perf: (performance) 用于性能优化。
```
git add prompts/my_app_service_A/summarizer/v1/default_summary_prompt.json
git commit -m "feat: (summarizer) Add 'output_language' parameter to summary prompt"
```

推送到远程仓库：

git push origin feature/add-language-option-to-summarizer

创建 Pull Request (PR) 并合并到 develop：
在 Git 托管平台（如 GitHub, GitLab, Bitbucket）上创建 PR，请求将 feature/add-language-option-to-summarizer 合并到 develop。团队成员审查通过后，执行合并。

# 假设PR已批准并合并，本地切换回develop分支并拉取最新
git checkout develop
git pull origin develop
# 删除 feature 分支
git branch -d feature/add-language-option-to-summarizer
git push origin --delete feature/add-language-option-to-summarizer

场景二：准备发布新版本 (v1.1.0) – 包含上述新功能

从 develop 分支创建 release 分支：

git checkout develop
git pull origin develop
git checkout -b release/v1.1.0

进行最终测试，并可能进行 PATCH 级别的修复：
如果在 release/v1.1.0 分支上发现任何小错误（例如，新的语言参数导致模型偶尔输出格式不正确），在此分支上进行修复。
```
# 假设修复了一个小问题
git commit -m "fix: (summarizer) Adjust template for better language handling in v1.1.0"
```

合并到 main 和 develop：
当 release 分支稳定后，首先合并到 main 分支。

git checkout main
git pull origin main # 确保本地 main 分支最新
git merge --no-ff release/v1.1.0 -m "Merge branch 'release/v1.1.0' into main"

然后，合并回 develop 分支，确保 develop 包含了 release 分支上的所有修复。

git checkout develop
git merge --no-ff release/v1.1.0 -m "Merge branch 'release/v1.1.0' into develop"

打 SemVer 标签并推送到远程仓库：
在 main 分支上打上语义化版本标签。

git checkout main
git tag -a v1.1.0 -m "Release v1.1.0: Added output language option to summarizer prompt."
git push origin main --tags # 推送 main 分支和所有标签

删除 release 分支：

git branch -d release/v1.1.0
git push origin --delete release/v1.1.0

场景三：紧急修复生产环境中的提示词 (PATCH 变更)

假设 v1.1.0 已发布到生产环境，但发现 summarizer 提示词中有一个严重的拼写错误，导致某些情况下模型无法理解。

从 main 分支创建 hotfix 分支：

git checkout main
git pull origin main
git checkout -b hotfix/fix-summarizer-typo-v1.1.1

修复提示词文件：
打开 prompts/my_app_service_A/summarizer/v1/default_summary_prompt.json，修正拼写错误。

提交变更：

git add prompts/my_app_service_A/summarizer/v1/default_summary_prompt.json
git commit -m "fix: (summarizer) Correct typo in default summary prompt (v1.1.1)"

推送到远程仓库：

git push origin hotfix/fix-summarizer-typo-v1.1.1

创建 PR 并合并到 main 和 develop：
在 Git 托管平台创建 PR，请求合并到 main。审查通过后，执行合并。

git checkout main
git pull origin main # 确保本地 main 分支最新
git merge --no-ff hotfix/fix-summarizer-typo-v1.1.1 -m "Merge hotfix/fix-summarizer-typo-v1.1.1 into main"

同时，将此修复合并到 develop 分支，避免未来发布时再次引入此问题。

git checkout develop
git pull origin develop
git merge --no-ff hotfix/fix-summarizer-typo-v1.1.1 -m "Merge hotfix/fix-summarizer-typo-v1.1.1 into develop"

打新的 PATCH 标签并推送到远程仓库：

git checkout main
git tag -a v1.1.1 -m "Hotfix Release v1.1.1: Corrected typo in summarizer prompt."
git push origin main --tags

删除 hotfix 分支：

git branch -d hotfix/fix-summarizer-typo-v1.1.1
git push origin --delete hotfix/fix-summarizer-typo-v1.1.1

六、生产回滚策略：使用 Git 实现提示词的快速恢复

当新发布的提示词出现问题时，能够快速回滚到前一个稳定版本是生产环境的关键能力。Git 提供了多种回滚机制，但针对生产环境，我们通常推荐两种主要方法。

回滚的核心思想： 撤销已发布的变更，将生产环境的提示词恢复到一个已知稳定的历史版本。

方法一：基于 Git Tag 切换版本 (推荐用于部署)

这种方法不修改 Git 历史，而是通过部署系统指定要部署的 Git Tag 所对应的提示词版本。这是最安全、最常用的生产回滚方式。

适用场景： 线上部署的提示词版本出现问题，需要快速切换到上一个稳定版本。
原理： 部署系统在部署时，会拉取 Git 仓库中特定标签（如 v1.1.0）所指向的提交。要回滚，只需指示部署系统拉取并部署上一个稳定标签（如 v1.0.0）对应的提示词文件。
优点： 简单、快速、安全，不修改 Git 历史，易于理解和操作。
缺点： 依赖部署系统的支持。
操作示例 (概念性，具体取决于你的 CI/CD 系统)：
假设你的 CI/CD 管道在部署时接收一个版本号参数。
1. 部署 v1.1.0：
  deploy_prompts.sh --version v1.1.0
2. 发现问题，需要回滚到 v1.0.0：
  deploy_prompts.sh --version v1.0.0
3. 结果： 生产环境的提示词文件被替换为 v1.0.0 标签下的内容。

方法二：git revert (撤销特定提交)

git revert 用于撤销一个或多个已存在的提交。它通过创建一个新的提交来反转之前提交所做的更改。这意味着 Git 历史记录是保留的，而不会被修改。

适用场景：
- 某个 MINOR 版本的提示词更新（例如 v1.1.0 引入了一个新功能），在生产环境发现问题，想完全撤销这次功能更新，但保留更早的 PATCH 修复。
- 在 develop 分支上发现某个提交引入了问题，想在合并到 main 之前撤销它。
原理： git revert 会创建一个新的提交，其内容是目标提交的逆操作。如果目标提交增加了几行，revert 提交就会删除这几行。
优点： 保留完整的 Git 历史，可以精确撤销单个或多个提交，适合追溯问题。
缺点： 会在历史中留下“撤销提交”，对于需要撤销大量连续提交的情况，可能会产生复杂的历史。
操作示例：
假设 v1.1.0 是由一个名为 feat: (summarizer) Add 'output_language' parameter 的提交引入的。
1. 在 main 分支上找到要撤销的提交的哈希值：
```
git checkout main
git log --oneline
# 假设输出如下，我们要撤销 'abcdef1'
# ghi7890 (HEAD -> main, origin/main) Merge hotfix/fix-summarizer-typo-v1.1.1 into main
# abcdef1 Release v1.1.0: Added output language option to summarizer prompt.
# 1234567 Merge branch 'feature/add-language-option-to-summarizer' into develop
```
  更准确地，我们通常撤销导致问题的那个 功能性提交，而不是合并提交。假设 abcdef1 是 v1.1.0 的发布提交，它包含了某个 feature 分支的合并。我们需要找到那个 feature 分支的根提交。
  如果 v1.1.0 对应的合并提交是 abcdef1，而我们想撤销这个合并带来的所有变更，我们可以 revert 那个合并提交。
  
  更推荐的方式是：回滚到上一个稳定标签，然后基于那个标签重新进行修复或修改。git revert 更多用于撤销单一、明确的非合并提交。
  
  但如果确实需要撤销一个特定的非合并提交：
```
# 假设导致问题的提交哈希是 'abcdef1'
git revert abcdef1 -m "revert: (summarizer) Revert 'Add output_language' due to production issues"
git push origin main
```
2. 结果： Git 会创建一个新的提交，其内容是撤销 abcdef1 提交所做的更改。之后，你需要发布一个新的版本（例如 v1.1.2），因为这是一个新的变更。

方法三：git reset --hard (慎用，会改写历史)

git reset --hard 会将 HEAD 指针和工作目录都重置到指定的提交，并丢弃该提交之后的所有历史。这会改写 Git 历史。

适用场景： 仅在本地开发环境中，或者你非常清楚后果且未推送到共享仓库时使用。绝不应该在共享的 main 或 develop 分支上使用。
原理： 直接修改分支的 HEAD 指针。
优点： 本地清理历史非常方便。
缺点： 破坏性强，会丢失历史，且可能导致团队成员之间的仓库不一致。

方法四：git checkout <tag> 或 git checkout <commit-hash> (本地查看)

这并非生产回滚方法，而是用于在本地快速切换到某个历史状态，进行代码审查、调试或验证。

操作示例：

git checkout v1.0.0 # 切换到 v1.0.0 版本的提示词文件状态
# 进行查看或测试
git checkout develop # 返回开发分支

回滚方法对比表：

方法	适用场景	是否修改 Git 历史	优点	缺点
基于 Git Tag 切换	生产环境快速回滚到前一稳定版本	否	最安全、最常用、不改写历史	依赖部署系统支持
`git revert`	撤销特定非合并提交	否 (新增撤销提交)	保留完整历史，可精确撤销	历史中会留下“撤销提交”，可能使历史复杂
`git reset --hard`	本地开发环境重置	是 (丢弃历史)	本地清理方便	极具破坏性，不应在共享分支使用
`git checkout`	本地查看历史版本	否	快速切换到任意历史状态进行查阅/调试	非生产回滚方法，不用于部署

七、提示词的 CI/CD 集成

将提示词管理与 CI/CD 管道集成，可以实现自动化验证、测试和部署，大大提高效率和可靠性。

1. 持续集成 (CI)：

触发条件： 每次提交到 develop 或 main 分支，或创建 Pull Request 时触发。

自动化任务：

语法检查 (Linting)： 检查 JSON/YAML 文件的语法是否正确。
格式化检查： 确保提示词文件遵循统一的格式规范。
语义检查 (可选)： 使用规则引擎或小型语言模型，对提示词进行初步的语义验证，例如检查是否包含禁止词汇、是否符合预期结构要求等。
单元测试 (可选)： 如果提示词有明确的输入输出预期，可以编写简单的测试用例，模拟输入，调用一个小型模型或模拟器，检查输出是否符合预期。

示例：GitHub Actions 配置片段 (.github/workflows/ci-prompts.yml)

name: Prompt CI/CD

on:
  push:
    branches:
      - main
      - develop
  pull_request:
    branches:
      - main
      - develop

jobs:
  lint_and_test:
    runs-on: ubuntu-latest
    steps:
    - name: Checkout repository
      uses: actions/checkout@v3

    - name: Set up Python
      uses: actions/setup-python@v4
      with:
        python-version: '3.x'

    - name: Install dependencies
      run: |
        pip install pyyaml yamllint jsonschema

    - name: Lint JSON prompts
      run: |
        echo "Linting JSON files..."
        find prompts/ -name "*.json" -print0 | xargs -0 -I {} python -m json.tool {}

    - name: Lint YAML prompts
      run: |
        echo "Linting YAML files..."
        find prompts/ -name "*.yaml" -print0 | xargs -0 yamllint

    # - name: Validate JSON prompts against schema (Optional)
    #   run: |
    #     # You would need a schema definition, e.g., prompts/schema/prompt_schema.json
    #     # And a script to validate each prompt against it
    #     echo "Validating JSON prompts against schema..."
    #     python scripts/validate_prompts.py --schema prompts/schema/prompt_schema.json prompts/

    # - name: Basic prompt functional test (Optional - requires LLM access or mock)
    #   run: |
    #     echo "Running basic functional tests for prompts..."
    #     # Example: a Python script that loads a prompt and sends a test input to a mocked LLM
    #     # python tests/prompt_functional_tests.py

2. 持续部署 (CD)：

触发条件： 当 main 分支被打上新的 SemVer 标签时（例如 v1.1.0），或合并到 main 分支时。

自动化任务：

拉取指定版本： 从 Git 仓库拉取最新标签（或最新提交）对应的提示词文件。
打包/上传： 将提示词文件打包（例如为 ZIP 或 tar.gz），然后上传到对象存储（如 AWS S3, Azure Blob Storage）或配置管理服务。
更新应用配置： 通知应用程序或提示词管理服务，有新的提示词版本可用，并更新其配置指向新版本。
部署策略： 支持蓝绿部署、金丝雀发布等策略，以最小化风险。

示例：GitHub Actions 配置片段 (.github/workflows/deploy-prompts.yml)

name: Deploy Prompts to Production

on:
  push:
    tags:
      - 'v*.*.*' # 当有新的语义化版本标签被推送到远程仓库时触发

jobs:
  deploy:
    runs-on: ubuntu-latest
    environment: production # 指定部署到生产环境
    steps:
    - name: Checkout repository
      uses: actions/checkout@v3
      with:
        ref: ${{ github.ref }} # 检出当前标签对应的提交

    - name: Install deployment tools (e.g., AWS CLI, Azure CLI)
      run: |
        # Example: pip install awscli

    - name: Deploy prompts to object storage or prompt service
      env:
        # 假设使用云存储或自定义API密钥进行部署
        AWS_ACCESS_KEY_ID: ${{ secrets.AWS_ACCESS_KEY_ID }}
        AWS_SECRET_ACCESS_KEY: ${{ secrets.AWS_SECRET_ACCESS_KEY }}
        PROMPT_SERVICE_API_KEY: ${{ secrets.PROMPT_SERVICE_API_KEY }}
        PROMPT_VERSION: ${{ github.ref_name }} # 获取标签名称，例如 v1.1.0

      run: |
        echo "Deploying prompts version ${{ env.PROMPT_VERSION }} to production..."

        # 示例1: 将 prompts/ 目录上传到 S3 桶
        # aws s3 sync prompts/ s3://my-prod-prompt-bucket/${{ env.PROMPT_VERSION }}/ --delete

        # 示例2: 打包 prompts/ 目录并上传到自定义提示词管理服务
        zip -r prompts.zip prompts/
        curl -X POST -H "Authorization: Bearer ${{ env.PROMPT_SERVICE_API_KEY }}" 
             -F "version=${{ env.PROMPT_VERSION }}" 
             -F "[email protected]" 
             https://api.promptservice.com/deploy_new_version

        echo "Deployment successful for version ${{ env.PROMPT_VERSION }}"

    - name: Notify team (e.g., Slack, Teams)
      if: success()
      run: |
        # Example: Send a notification that new prompts are deployed
        echo "Prompts version ${{ env.PROMPT_VERSION }} deployed to production successfully!"
        # curl -X POST -H 'Content-type: application/json' --data '{"text":"Prompts version ${{ env.PROMPT_VERSION }} deployed to production successfully!"}' ${{ secrets.SLACK_WEBHOOK_URL }}

八、多环境管理：开发、测试、生产的提示词差异

在不同的环境中（开发、测试、生产），我们可能希望提示词的行为或所使用的底层模型有所差异。

不推荐的做法：为每个环境维护一套独立的提示词文件。
例如：prompts/dev/summarize.json, prompts/prod/summarize.json。
这会导致大量重复代码，难以同步变更，且容易出错。

推荐做法：单一提示词模板 + 运行时参数注入

将环境差异作为参数，在应用程序运行时注入到提示词中。Git 仓库中只维护核心的提示词逻辑。

提示词模板化： 在提示词文件中使用占位符来表示环境特定的配置。

{
  "version": "1.0.0",
  "name": "Summarizer Prompt",
  "system_message": "You are a helpful assistant that summarizes text. Use model: {{MODEL_NAME}}.",
  "user_message_template": "Please summarize the following text:nn---n{{text_to_summarize}}n---nnFocus on the key points and keep the summary to a maximum of {{MAX_WORDS}} words. Respond in {{OUTPUT_LANGUAGE}}.",
  "parameters": {
    "text_to_summarize": {"type": "string", "required": true},
    "MAX_WORDS": {"type": "integer", "required": false, "default": "{{DEFAULT_MAX_WORDS}}"},
    "OUTPUT_LANGUAGE": {"type": "string", "required": false, "default": "{{DEFAULT_LANGUAGE}}"}
  }
}

环境配置文件： 在应用程序的配置中，为每个环境定义这些占位符的具体值。

config_dev.json:

{
  "MODEL_NAME": "gpt-3.5-turbo",
  "DEFAULT_MAX_WORDS": 50,
  "DEFAULT_LANGUAGE": "English"
}

config_prod.json:

{
  "MODEL_NAME": "gpt-4-turbo",
  "DEFAULT_MAX_WORDS": 100,
  "DEFAULT_LANGUAGE": "Chinese"
}

应用程序运行时渲染： 应用程序根据当前运行环境加载对应的配置文件，然后将配置值替换到提示词模板的占位符中，生成最终的提示词。

伪代码示例：

import os
import json
import re

def load_prompt_template(filepath):
    with open(filepath, 'r', encoding='utf-8') as f:
        return f.read()

def load_env_config(env):
    config_file = f"config_{env}.json"
    with open(config_file, 'r', encoding='utf-8') as f:
        return json.load(f)

def render_prompt(template_content, config):
    rendered_prompt = template_content
    for key, value in config.items():
        placeholder = f"{{{{{key}}}}}"
        rendered_prompt = rendered_prompt.replace(placeholder, str(value))
    return rendered_prompt

if __name__ == "__main__":
    current_env = os.environ.get("APP_ENV", "dev") # 从环境变量获取当前环境

    prompt_template = load_prompt_template("prompts/my_app_service_A/summarizer/v1/default_summary_prompt.json")
    env_config = load_env_config(current_env)

    final_prompt_json_str = render_prompt(prompt_template, env_config)
    final_prompt = json.loads(final_prompt_json_str) # 解析为JSON对象

    print(f"--- Final Prompt for {current_env} environment ---")
    print(json.dumps(final_prompt, indent=2, ensure_ascii=False))

    # 此时 final_prompt['system_message'] 就会是 "You are a helpful assistant that summarizes text. Use model: gpt-3.5-turbo." 或 "gpt-4-turbo."

这种方法确保了提示词的核心逻辑在所有环境中保持一致，只有环境相关的配置被动态注入，大大简化了管理和维护。

九、总结与展望

将提示词视为 AI 应用的核心代码资产，并采纳软件工程的成熟实践，例如语义化版本控制和 Git 工作流，是构建可靠、可维护 AI 系统的关键。这不仅能有效管理提示词的变更，保障团队协作效率，还能在面对生产问题时，提供快速、精准的回滚能力，从而显著提升 AI 应用的稳定性和可控性。