🎯 Prompt Engineering 技巧

大语言模型提示工程完全指南

源码级别解析 · 2026年最新实践 · 深度解析
2026-05-11 | 每日技术深度解读

目录

本次内容概览
  • 1. 提示工程的重要性
  • 2. 基础技巧
  • 3. 推理技术
  • 4. 高级方法
  • 5. 模型优化
  • 6. 实际应用
  • 7. 最佳实践

涵盖114种技术中的核心内容

为什么提示工程在2026年更重要

三大关键变化
  • 智能体系统:AI执行多步工作流
  • 规模化成本:GPT-5.5每百万token $10/$30
  • 模型多样性:团队需要在3-5个模型间路由

提示质量直接影响20-60%的输出质量提升

提示工程市场现状

快速增长的市场
  • 全球市场价值69.5亿美元
  • 年复合增长率33%(至2034年)
  • 90%开发者每天至少使用一个AI工具

专业提示工程师与业余水平的差距可测量化

基础技巧一:Zero-Shot Prompting

无需示例的直给指令
  • 直接要求模型完成任务
  • 适用于简单任务和分类
  • 局限性:复杂任务效果不佳

最基础的提示方式,适用于模型已经理解的任务类型

Zero-Shot Prompting 示例

# 翻译任务
prompt = "请将以下中文翻译成英文:\n\n人工智能技术正在快速发展。\n\n只输出翻译结果,不要其他内容。"

# 分类任务
prompt = "请将以下文本分类为正面、负面或中性:\n\n产品功能很实用,界面设计也不错。"

categories = ["正面", "负面", "中性"]

Zero-shot适用于模型已经训练过的任务类型

基础技巧二:Direct Instruction

明确指令引导
  • 使用清晰、直接的语言
  • 避免模糊和歧义
  • 指定输出格式要求

直接指令是最可靠的提示方式之一

Direct Instruction 示例

prompt = """
请帮我分析以下代码的性能问题:

def calculate_fibonacci(n):
    if n <= 1:
        return n
    return calculate_fibonacci(n-1) + calculate_fibonacci(n-2)

请按照以下格式输出:
1. 性能问题:[描述问题]
2. 时间复杂度:[分析复杂度]
3. 优化建议:[具体改进方案]
"""

明确指定输出格式,让模型知道如何组织回答

基础技巧三:System Prompting

系统级指令设定
  • 定义AI的角色和行为准则
  • 设定回答风格和格式
  • 控制安全边界

System prompt控制AI的整体行为和风格

System Prompt 示例

system_prompt = """
你是一位专业的代码审查工程师,具有以下特征:
- 专注于代码质量和安全性
- 提供具体、可执行的改进建议
- 遵循最佳编程实践
- 回答要结构化、条理清晰

当你分析代码时,请从以下角度评估:
1. 代码可读性
2. 性能优化
3. 安全性考虑
4. 最佳实践遵循
"""

System prompt为AI设定专业角色和行为规范

基础技巧四:Context Setting

上下文设定技巧
  • 提供充分的背景信息
  • 设定场景和目标
  • 明确用户意图

好的上下文设定能显著提升回答质量

Context Setting 示例

context_prompt = """
【场景】你正在为一个电商平台设计用户推荐系统
【目标】提高用户购买转化率,同时保持推荐的个性化
【用户画像】25-35岁白领,喜欢科技产品,预算中等,追求性价比
【产品数据】包含10000+商品,分为5个主要类别

请设计一个推荐算法的伪代码实现。要求:
1. 考虑用户历史行为
2. 处理新用户冷启动问题
3. 平衡推荐多样性和精准度
"""

明确的上下文设定让AI更好地理解任务需求

基础技巧五:Delimiter Usage

分隔符使用技巧
  • 使用明确的分隔符
  • 区分不同类型的输入
  • 避免内容混淆

分隔符能帮助模型更好地理解和处理结构化内容

Delimiter Usage 示例

prompt = """
请分析以下用户评论,并提取关键信息:

---用户评论---
"这个产品真的很好用,物流速度很快,客服态度也不错,就是价格稍微贵了一点。"
---结束---

请按照以下格式提取信息:
---正面评价---
[提取正面内容]
---负面评价---
[提取负面内容]
---改进建议---
[提出改进建议]
---结束---
"""

使用明确的分隔符帮助模型理解和提取结构化信息

基础技巧六:Explicit Constraints

明确约束条件
  • 设定具体的输出限制
  • 控制输出长度和格式
  • 避免内容越界

明确的约束条件能帮助生成更符合预期的输出

Explicit Constraints 示例

prompt = """
请写一个关于人工智能的简短介绍,要求:
- 长度在200-300字之间
- 使用通俗易懂的语言
- 包含至少3个应用场景
- 不要使用专业术语
- 以正向积极的态度结尾

请直接输出内容,不要包含标题或其他格式。
"""

明确的约束条件帮助生成符合特定要求的内容

基础技巧七:Output Priming

输出模式引导
  • 指定输出格式和结构
  • 提供模板示例
  • 控制内容组织方式

输出引导能帮助模型生成更结构化的回答

Output Priming 示例

prompt = """
请分析以下Python代码的性能问题:

def process_data(data):
    result = []
    for item in data:
        if item['type'] == 'important':
            processed = item['value'] * 2
            result.append(processed)
    return result

请按照以下格式分析:
## 性能分析
1. 时间复杂度: O(n)
2. 空间复杂度: O(n)
3. 潜在问题:
   - 每次循环都进行类型检查
   - 没有使用列表推导式
## 优化建议
1. 使用列表推导式
2. 预先过滤数据
3. 使用更高效的数据结构
"""

提供明确的输出模板,让模型按照特定结构回答

基础技巧八:Prompt Chaining

提示链技巧
  • 将复杂任务分解为简单步骤
  • 逐步引导模型完成任务
  • 利用前一步的输出作为下一步的输入

提示链适合处理多步骤的复杂任务

Prompt Chaining 示例

# 第一步:提取数据
prompt1 = """
从以下新闻文本中提取公司名称和股价信息:
"苹果公司今日股价上涨5%,达到182美元。特斯拉股价下跌2%,收于245美元。"
"""

# 第二步:分析趋势
prompt2 = """
基于以下数据,分析股价趋势并预测明天走势:
{step1_output}
"""

# 第三步:生成报告
prompt3 = """
根据以上分析,生成一份简短的股票分析报告:
{step2_output}
"""

通过多个步骤逐步完成复杂任务,每步结果传递给下一步

推理技术一:Chain-of-Thought (CoT)

思维链推理
  • 让模型展示推理过程
  • 提高复杂任务的准确性
  • 支持多步逻辑推理

CoT能提升数学、逻辑等复杂任务15-40%的准确率

Chain-of-Thought 示例

# Zero-shot CoT
prompt = """
一个商人买了一批货物,成本价是100元。他想卖150元,但如果市场价格降到120元,他就以120元卖出。
现在市场价格是130元,商人应该以什么价格出售?请逐步推理。

推理过程:
1. 商人的目标是以尽可能高的价格出售
2. 当前市场价格是130元,高于他的心理价位150元
3. 但是市场价格130元低于他期望的150元
4. 他可以选择等待更好的价格,但存在风险
5. 综合考虑,应该以市场价格130元出售

结论:商人应该以130元出售。
"""

让模型逐步展示推理过程,提高回答的可信度

推理技术二:Zero-Shot CoT

零样本思维链
  • 简单的提示触发推理
  • 无需提供推理示例
  • 适用于大多数推理任务

只需添加"请逐步思考"就能触发CoT效果

Zero-Shot CoT 示例

# 简单的Zero-Shot CoT
prompt = """
计算:如果一本书有300页,小明每天读20页,需要多少天才能读完?请逐步思考并给出答案。
"""

prompt2 = """
一家公司有100名员工,其中60%是技术部门,技术部门中30%是高级工程师。
请问这家公司有多少高级工程师?请逐步推理。
"""

只需在提示中要求逐步思考,就能触发模型进行逻辑推理

推理技术三:Self-Consistency

自一致性检查
  • 生成多个推理路径
  • 选择最一致的答案
  • 提高回答的可靠性

通过多次推理选择一致性答案,提高准确率

Self-Consistency 示例

# 多个推理路径
prompt = """
一个水池有进水管和出水管,进水管每分钟注入5升水,出水管每分钟排出3升水。
如果水池原本有100升水,10分钟后水池有多少水?请给出不同的推理方法。

推理方法1:净增水量
- 每分钟净增:5-3=2升
- 10分钟净增:2×10=20升
- 最终水量:100+20=120升

推理方法2:累计计算
- 进水总量:5×10=50升
- 出水总量:3×10=30升
- 最终水量:100+50-30=120升

结论:两种方法都得到120升
"""

通过不同的推理方法验证答案的一致性

推理技术四:Tree of Thoughts (ToT)

思维树推理
  • 探索多个推理路径
  • 并行思考不同方案
  • 选择最优的推理路径

ToT是CoT的扩展,支持更复杂的推理决策

Tree of Thoughts 示例

# ToT推理示例
prompt = """
考虑为电商设计推荐系统,请提出3种不同方法并评估:

方法A:基于内容的推荐
- 基于商品特征相似度
- 优点:解释性强,不受冷启动影响
- 缺点:需要高质量特征工程

方法B:协同过滤推荐
- 基于用户行为相似度
- 优点:自动发现用户兴趣
- 缺点:冷启动问题严重

方法C:深度学习推荐
- 基于神经网络建模
- 优点:能捕获复杂非线性关系
- 缺点:需要大量数据和计算资源

评估标准:准确性、可扩展性、实现复杂度、维护成本
最佳选择:混合推荐系统,结合方法A和B的优点
"""

思维树支持并行探索多个解决方案,选择最优路径

推理技术五:Decomposed Prompting

分解式提示
  • 将复杂任务分解为子任务
  • 逐个解决子问题
  • 整合子问题解决方案

分解式提示适合处理复杂的多步骤任务

Decomposed Prompting 示例

# 复杂任务分解
prompt = """
请设计一个完整的电商推荐系统,要求分解为以下子任务:

子任务1:数据收集
- 用户行为数据:浏览、点击、购买、收藏
- 商品特征数据:类别、价格、评分、描述
- 用户画像数据:年龄、性别、地理位置

子任务2:特征工程
- 用户特征提取:兴趣偏好、购买力、活跃度
- 商品特征提取:流行度、季节性、相关性
- 交互特征提取:点击率、转化率、留存率

子任务3:模型选择
- 协同过滤:基于用户的CF,基于物品的CF
- 内容推荐:基于商品特征的相似度计算
- 深度学习:DNN、Wide&Deep、DeepFM

子任务4:系统集成
- A/B测试框架
- 实时更新机制
- 效果评估指标

请分别设计每个子任务的详细实现方案。
"""

将复杂任务分解为可管理的子任务,逐个解决

推理技术六:Program-Aided LLM (PAL)

程序辅助推理
  • 结合程序逻辑和语言推理
  • 利用代码进行精确计算
  • 提高数学和逻辑任务的准确性

PAL将LLM的程序生成能力与逻辑推理相结合

Program-Aided LLM 示例

# PAL推理示例
prompt = """
请使用Python代码解决以下问题,并解释推理过程:

问题:一个投资组合包含股票和债券,股票占60%,债券占40%。股票年化收益率是12%,债券年化收益率是4%。
如果投资组合的总价值是100万元,一年后的总价值是多少?

Python代码:
```python
# 投资组合分析
total_investment = 1000000  # 总投资100万元
stock_ratio = 0.6           # 股票占比60%
bond_ratio = 0.4            # 债券占比40%
stock_return = 0.12         # 股票收益率12%
bond_return = 0.04          # 债券收益率4%

# 计算各部分投资金额
stock_amount = total_investment * stock_ratio
bond_amount = total_investment * bond_ratio

# 计算各部分收益
stock_profit = stock_amount * stock_return
bond_profit = bond_amount * bond_return

# 计算总价值
final_value = total_investment + stock_profit + bond_profit

print(f"股票投资金额: {stock_amount:,.0f}元")
print(f"债券投资金额: {bond_amount:,.0f}元")
print(f"股票收益: {stock_profit:,.0f}元")
print(f"债券收益: {bond_profit:,.0f}元")
print(f"最终总价值: {final_value:,.0f}元")
```

推理结果:
- 股票投资60万元,收益7.2万元
- 债券投资40万元,收益1.6万元
- 总收益8.8万元
- 最终总价值108.8万元
"""

通过程序代码进行精确计算,结合语言推理给出解释

推理技术七:ReAct (Reasoning + Acting)

行动推理框架
  • 结合推理和行动步骤
  • 支持多轮交互
  • 适用于复杂决策任务

ReAct框架让AI能够进行思考和行动的循环

ReAct 框架示例

# ReAct框架示例
prompt = """
请使用ReAct框架解决以下问题:

问题:我需要为公司年会预订场地,要求:
1. 容纳200人
2. 有音响设备
3. 预算不超过3万元
4. 在北京朝阳区

ReAct推理过程:

Thought: 我需要搜索北京的会议场地信息
Action: 搜索北京朝阳区会议场地
Observation: 找到3个场地:北京国际会议中心、朝阳大悦城会议厅、望京SOHO会议室

Thought: 需要检查场地的容量和设备
Action: 查询北京国际会议中心详情
Observation: 容量500人,有专业音响设备,租金2.8万元/天

Thought: 这个场地符合要求,容量足够,价格在预算内
Action: 确认预订北京国际会议中心
Observation: 预订成功,场地已锁定在2026年12月15日

Conclusion: 成功预订北京国际会议中心,容量500人满足200人需求,有音响设备,租金2.8万元在3万元预算内。
"""

ReAct框架结合了推理和行动,支持复杂任务的逐步解决

推理技术八:Reflexion

反思机制
  • 检查推理过程中的错误
  • 修正错误的推理路径
  • 改进推理质量

反思机制让AI能够识别和纠正自己的推理错误

Reflexion 示例

# Reflexion反思机制
prompt = """
请使用反思机制分析以下代码的错误:

原始代码:
```python
def fibonacci(n):
    if n == 0:
        return 0
    elif n == 1:
        return 1
    return fibonacci(n-1) + fibonacci(n+1)  # 错误在这里
```

反思过程:
Thought: 检查fibonacci函数的实现
Action: 分析函数逻辑
Observation: fibonacci(n+1)应该是fibonacci(n-2)

Thought: 验证正确性
Action: 用n=5测试
Observation: fibonacci(5) = fibonacci(4) + fibonacci(6),这会导致无限递归

Thought: 修正错误
Action: 将n+1改为n-2
Observation: fibonacci(5) = fibonacci(4) + fibonacci(3),正确

修正后的代码:
```python
def fibonacci(n):
    if n == 0:
        return 0
    elif n == 1:
        return 1
    return fibonacci(n-1) + fibonacci(n-2)  # 修正错误
```
"""

反思机制让AI能够识别和纠正自己的推理错误

推理技术九:Logical Verification

逻辑验证
  • 验证推理的逻辑性
  • 检查前提条件
  • 确保结论的合理性

逻辑验证确保推理过程的正确性

Logical Verification 示例

# 逻辑验证示例
prompt = """
请验证以下推理的逻辑性:

推理:所有鸟都会飞,企鹅是鸟,所以企鹅会飞。

逻辑验证步骤:
1. 检查前提条件:
   - 前提1:所有鸟都会飞
   - 前提2:企鹅是鸟

2. 检查前提的准确性:
   - 前提1有问题:不是所有鸟都会飞(如企鹅、鸵鸟等)
   - 前提2正确:企鹅确实是鸟类

3. 检查推理规则:
   - 推理规则:如果所有A都是B,C是A,那么C是B
   - 推理规则正确

4. 检查结论:
   - 结论:企鹅会飞
   - 结论错误,因为前提1不正确

修正后的推理:
重新定义前提:大多数鸟会飞,但有些鸟(如企鹅)不会飞。
企鹅是不会飞的鸟类,所以结论正确。

最终结论:原推理存在逻辑错误,需要修正前提条件。
"""

逻辑验证确保推理过程的前提、规则和结论都正确

推理技术十:Proof Generation

证明生成
  • 生成形式化证明
  • 支持数学和逻辑推理
  • 确保结论的可靠性

证明生成支持严格的数学和逻辑推理

Proof Generation 示例

# 证明生成示例
prompt = """
请为勾股定理生成一个形式化证明:

定理:在直角三角形中,直角边的平方和等于斜边的平方。
即:a² + b² = c²

证明过程:

1. 已知条件:
   - △ABC是直角三角形,∠C=90°
   - AB为斜边,长度为c
   - AC为直角边,长度为b
   - BC为直角边,长度为a

2. 构造辅助图形:
   - 以△ABC为基础,构造4个相同的直角三角形
   - 将这4个三角形围绕一个正方形排列
   - 形成边长为(a+b)的大正方形

3. 面积计算:
   - 大正方形面积:(a+b)² = a² + 2ab + b²
   - 内部小正方形面积:c²
   - 4个三角形面积:4 × (½ab) = 2ab
   - 总面积:c² + 2ab

4. 面积相等性:
   - 大正方形面积 = 内部小正方形面积 + 4个三角形面积
   - (a+b)² = c² + 2ab
   - a² + 2ab + b² = c² + 2ab

5. 结论:
   - 两边同时减去2ab
   - a² + b² = c²

证毕。
"""

证明生成支持严格的数学定理证明,确保结论的可靠性

高级技术一:Meta-Prompting

元提示技术
  • 让模型改进自己的提示
  • 自我反思和优化
  • 持续提升提示质量

元提示让AI能够分析和改进自己的提示设计

Meta-Prompting 示例

# Meta-Prompting示例
prompt = """
请完成以下任务,然后对自己的回答进行反思和改进:

任务:为电商推荐系统设计一个评价指标体系

初始回答:
评价指标包括:点击率、转化率、GMV、用户满意度

反思:
1. 评价指标是否全面?
   - 缺少用户留存指标
   - 缺少多样性指标
   - 缺少公平性指标

2. 评价指标是否可量化?
   - 用户满意度需要具体测量方法
   - 多样性需要明确定义

改进:
1. 完善指标体系:
   - 业务指标:点击率、转化率、GMV、客单价、复购率
   - 用户体验指标:留存率、满意度、NPS、使用时长
   - 系统性能指标:响应时间、准确率、覆盖率
   - 公平性指标:多样性、公平性、偏见度

2. 定义测量方法:
   - 用户满意度:问卷调查+用户反馈分析
   - 多样性:不同类别商品的推荐比例
   - 公平性:不同用户群体的推荐质量对比

最终改进后的评价指标体系更加全面和可操作。
"""

元提示让AI能够反思和改进自己的提示设计

高级技术二:DSPy框架

DSPy自动化优化
  • 程序化提示管理
  • 自动优化提示质量
  • 支持多模型适配

DSPy是声明式的自改进Python框架

DSPy 框架示例

# DSPy框架示例
class ReviewAnalysis(dspy.Module):
    def __init__(self):
        self.analyze = dspy.Predict(
            "review: str -> sentiment: str, aspects: list, suggestions: list"
        )
    
    def forward(self, review):
        return self.analyze(review=review)

# 使用示例
review = "产品功能很好,但客服响应太慢,希望改进服务体验。"

# 初始化优化器
teleprompter = BootstrapFewShotWithRandomSearch(metric=validate_review)

# 优化提示
optimized_program = teleprompter.compile(
    ReviewAnalysis(), 
    trainset=train_reviews
)

# 使用优化后的程序
result = optimized_program(review)
print(f"情感: {result.sentiment}")
print(f"方面: {result.aspects}")
print(f"建议: {result.suggestions}")

DSPy用程序化方式管理提示,自动优化提示质量

高级技术三:Constitutional AI

宪法AI
  • 基于原则的AI行为规范
  • 安全和道德约束
  • 减少有害输出

宪法AI基于道德原则约束AI行为

Constitutional AI 示例

# Constitutional AI示例
constitution = """
AI宪法原则:
1. 真实性:不传播虚假信息
2. 公平性:避免偏见和歧视
3. 安全性:不造成伤害
4. 透明性:解释决策依据
5. 隐私性:保护用户数据
6. 负责任:考虑社会影响
"""

# 宪法检查函数
def constitutional_check(response, question, constitution):
    violations = []
    
    # 检查真实性
    if "虚假信息" in response.lower() or "不确定" in response.lower():
        violations.append("违反真实性原则")
    
    # 检查公平性
    if "所有" in response.lower() and "都" in response.lower():
        violations.append("可能存在过度概括")
    
    # 检查安全性
    if "危险" in response.lower() or "风险" in response.lower():
        violations.append("包含安全风险")
    
    return violations

# 使用宪法约束生成回答
def generate_safe_response(question):
    # 生成初步回答
    response = generate_response(question)
    
    # 宪法检查
    violations = constitutional_check(response, question, constitution)
    
    # 如果有违规,重新生成
    if violations:
        response = generate_response_with_constraints(question, constitution)
    
    return response

宪法AI基于道德原则约束AI行为,确保输出安全和道德

高级技术四:Prompt Compression

提示压缩
  • 优化提示长度
  • 减少token使用
  • 保持提示效果

提示压缩减少token使用,降低成本

Prompt Compression 示例

# 提示压缩示例

# 原始提示 (120 tokens)
original_prompt = """
请你以专业软件工程师的身份,仔细分析以下Python代码的性能问题,
包括时间复杂度分析、空间复杂度分析、潜在的性能瓶颈,
并提供具体的优化建议。代码应该遵循Python最佳实践,
并且要考虑到可读性和可维护性。

def process_data(data):
    result = []
    for item in data:
        if item['type'] == 'important':
            processed = item['value'] * 2
            result.append(processed)
    return result
"""

# 压缩后的提示 (45 tokens)
compressed_prompt = """
分析以下Python代码的性能问题,提供优化建议。
考虑时间复杂度、空间复杂度、性能瓶颈。
遵循Python最佳实践,关注可读性和可维护性。

def process_data(data):
    result = []
    for item in data:
        if item['type'] == 'important':
            processed = item['value'] * 2
            result.append(processed)
    return result
"""

提示压缩减少token使用,在保持效果的同时降低成本

高级技术五:Few-Shot Learning

少样本学习
  • 提供少量示例
  • 控制输出格式
  • 提高特定任务准确性

少样本学习是最可靠的输出结构控制方法

Few-Shot Learning 示例

# 少样本学习示例
prompt = """
请根据以下示例,对新的用户评论进行情感分类:

示例1:
评论:"这个产品真的很棒,质量超出预期!"
分类:正面

示例2:
评论:"客服态度很差,等了很久都没有回复。"
分类:负面

示例3:
评论:"产品功能基本满足需求,但价格偏高。"
分类:中性

现在请分类以下评论:
评论:"物流速度快,包装很好,产品功能也不错。"
分类:
"""

通过少量示例控制输出的格式和质量

高级技术六:Agent Prompt Patterns

智能体提示模式
  • 多智能体协作
  • 角色分工
  • 任务分解

智能体提示模式支持复杂的多智能体协作任务

Agent Prompt Patterns 示例

# 智能体协作提示模式
prompt = """
请模拟一个多智能体团队完成电商推荐系统开发:

智能体1:产品经理
- 负责需求分析
- 定义产品功能
- 制定项目计划

智能体2:架构师
- 设计系统架构
- 选择技术栈
- 制定开发规范

智能体3:前端开发工程师
- 实现用户界面
- 处理用户交互
- 优化用户体验

智能体4:后端开发工程师
- 实现业务逻辑
- 设计数据库架构
- 开发API接口

智能体5:测试工程师
- 制定测试计划
- 执行功能测试
- 进行性能测试

请每个智能体分别完成自己的任务,然后整合结果。
"""

智能体提示模式支持复杂的多角色协作任务

模型特定技术一:OpenAI GPT-5.5

GPT-5.5 优化技巧
  • 利用新的推理能力
  • 结构化输出格式
  • 工具使用优化

针对GPT-5.5的特定优化技巧

GPT-5.5 优化示例

# GPT-5.5 优化示例
prompt = """
使用OpenAI GPT-5.5 API进行代码审查,要求:

1. 利用GPT-5.5的推理能力进行深度分析
2. 使用结构化JSON输出
3. 能够调用工具进行代码执行验证

API调用示例:
```python
from openai import OpenAI
client = OpenAI()

response = client.chat.completions.create(
    model="gpt-5.5",
    messages=[
        {
            "role": "system",
            "content": "你是专业的代码审查工程师,擅长深度代码分析和性能优化。"
        },
        {
            "role": "user",
            "content": "请审查以下代码并提供JSON格式报告",
            "tools": [
                {
                    "type": "function",
                    "function": {
                        "name": "execute_code",
                        "description": "执行代码并返回结果"
                    }
                }
            ]
        }
    ],
    response_format={"type": "json_object"}
)
```
"""

针对GPT-5.5的新特性进行优化,包括工具使用和结构化输出

模型特定技术二:Anthropic Claude

Claude 优化技巧
  • 利用Claude的上下文理解
  • 长文档处理
  • 复杂推理任务

针对Claude的特定优化技巧

Claude 优化示例

# Claude 优化示例
prompt = """
使用Anthropic Claude进行长文档分析,要求:

1. 利用Claude的100K上下文窗口
2. 处理完整的技术文档和代码库
3. 保持上下文连贯性

Claude API调用示例:
```python
from anthropic import Anthropic
client = Anthropic()

response = client.messages.create(
    model="claude-3-opus-4.7",
    max_tokens=4096,
    messages=[
        {
            "role": "system",
            "content": "你是技术文档专家,能够理解和分析复杂的技术文档。"
        },
        {
            "role": "user",
            "content": "请分析以下完整的技术文档:" + long_document
        }
    ]
)
```

Claude的优势:
- 100K上下文窗口
- 准确的中英双语能力
- 强大的逻辑推理能力
"""

利用Claude的长上下文和强推理能力处理复杂任务

模型特定技术三:Google Gemini

Gemini 优化技巧
  • 利用Gemini的多模态能力
  • 结构化数据处理
  • 实时信息整合

针对Gemini的多模态优化技巧

Gemini 优化示例

# Gemini 多模态优化示例
prompt = """
使用Google Gemini进行多模态分析,要求:

1. 利用Gemini的多模态能力处理文本、图像、音频
2. 进行实时信息整合和分析
3. 提供跨模态的理解和推理

Gemini API调用示例:
```python
import google.generativeai as genai

# 配置API
 genai.configure(api_key="your-api-key")
model = genai.GenerativeModel('gemini-3.1-pro')

# 多模态输入
response = model.generate_content([
    "分析以下产品图片和评论:",
    genai.upload_file("product_image.jpg"),
    "用户评论:这款产品功能很好,但价格偏高。"
])
```

Gemini的优势:
- 多模态理解能力
- 实时信息处理
- 跨语言支持
"""

利用Gemini的多模态能力进行跨媒体信息处理

评估技术一:Prompt Evaluation

提示评估方法
  • 性能指标定义
  • A/B测试框架
  • 效果量化分析

系统化的提示评估方法

Prompt Evaluation 示例

# 提示评估框架

class PromptEvaluator:
    def __init__(self):
        self.metrics = {
            'accuracy': [],
            'coherence': [],
            'relevance': [],
            'completeness': []
        }
    
    def evaluate_response(self, response, ground_truth):
        scores = {
            'accuracy': self.calculate_accuracy(response, ground_truth),
            'coherence': self.calculate_coherence(response),
            'relevance': self.calculate_relevance(response),
            'completeness': self.calculate_completeness(response)
        }
        return scores
    
    def run_ab_test(self, prompt_a, prompt_b, test_cases):
        results_a = []
        results_b = []
        
        for case in test_cases:
            response_a = get_response(prompt_a, case)
            response_b = get_response(prompt_b, case)
            
            score_a = self.evaluate_response(response_a, case['ground_truth'])
            score_b = self.evaluate_response(response_b, case['ground_truth'])
            
            results_a.append(score_a)
            results_b.append(score_b)
        
        return self.compare_results(results_a, results_b)
    
    def statistical_significance(self, results_a, results_b):
        # 计算统计显著性
        from scipy import stats
        return stats.ttest_ind(results_a, results_b)

系统化的提示评估框架,支持A/B测试和统计分析

评估技术二:Benchmark Testing

基准测试
  • 标准化测试数据集
  • 性能对比分析
  • 长期效果追踪

标准化基准测试体系

Benchmark Testing 示例

# 基准测试示例

class PromptBenchmark:
    def __init__(self):
        self.datasets = {
            'math_gsm8k': load_math_dataset(),
            'code_human_eval': load_code_dataset(),
            'reasoning_arc': load_reasoning_dataset()
        }
    
    def run_benchmark(self, prompt_template, model_name):
        results = {}
        
        for dataset_name, dataset in self.datasets.items():
            scores = []
            for example in dataset:
                response = get_response(prompt_template, example)
                score = self.score_response(response, example)
                scores.append(score)
            
            results[dataset_name] = {
                'mean_score': np.mean(scores),
                'std_score': np.std(scores),
                'accuracy': np.mean(scores)
            }
        
        return results
    
    def compare_models(self, model_a, model_b, prompt_templates):
        comparison_results = {}
        
        for template_name, template in prompt_templates.items():
            results_a = self.run_benchmark(template, model_a)
            results_b = self.run_benchmark(template, model_b)
            
            comparison_results[template_name] = {
                'model_a': results_a,
                'model_b': results_b,
                'improvement': self.calculate_improvement(results_a, results_b)
            }
        
        return comparison_results

标准化基准测试体系,支持多模型和提示效果对比

实际应用一:代码审查优化

代码审查应用
  • 自动化代码审查
  • 性能问题检测
  • 安全漏洞识别

提示工程在代码审查中的应用

代码审查提示示例

# 代码审查优化提示
prompt = """
请对以下Python代码进行全面的安全审查,重点关注:

1. 安全漏洞检查:
   - SQL注入风险
   - XSS漏洞
   - CSRF攻击
   - 敏感信息泄露
   - 不安全的随机数生成

2. 性能问题检查:
   - 时间复杂度分析
   - 内存使用优化
   - 数据库查询优化
   - 缓存策略

3. 代码质量检查:
   - 可读性评估
   - 代码重复度检查
   - 最佳实践遵循
   - 错误处理完整性

代码:
```python
def get_user_data(user_id):
    query = "SELECT * FROM users WHERE id = " + str(user_id)
    result = execute_query(query)
    return result

def process_request(request):
    data = request.get_json()
    if not data:
        return jsonify({'error': 'No data provided'}), 400
    
    user_id = data['user_id']
    user_data = get_user_data(user_id)
    
    return jsonify(user_data)
```

请按以下格式输出审查结果:
## 安全漏洞
[发现的安全问题及修复建议]

## 性能问题  
[发现的性能问题及优化建议]

## 代码质量
[发现的质量问题及改进建议]
"""

专门的代码审查提示,系统化检测安全和性能问题

实际应用二:内容生成优化

内容生成应用
  • 文案生成
  • 创意写作
  • 技术文档

提示工程在内容生成中的应用

内容生成提示示例

# 内容生成优化提示
prompt = """
请为电商平台生成产品推广文案,要求:

1. 文案结构:
   - 吸引人的标题(不超过20字)
   - 产品核心价值(3-5个卖点)
   - 用户使用场景(2-3个场景)
   - 行动号召(明确下一步行动)

2. 写作风格:
   - 简洁明了,避免复杂术语
   - 突出用户利益,而非技术参数
   - 使用情感化语言,营造紧迫感
   - 符合目标用户群体的语言习惯

3. 适用场景:
   - 产品详情页
   - 社交媒体推广
   - 电子邮件营销
   - 搜索引擎广告

产品信息:
- 产品名称:智能空气净化器
- 核心功能:HEPA过滤、智能监测、静音运行
- 目标用户:家庭用户、办公室人员
- 价格:2999元
- 竞争优势:3级过滤、智能控制、低噪音

请生成5个不同风格的产品推广文案。
"""

结构化的内容生成提示,确保输出的质量和一致性

实际应用三:数据分析

数据分析应用
  • 数据可视化
  • 统计分析
  • 预测模型

提示工程在数据分析中的应用

数据分析提示示例

# 数据分析提示
prompt = """
请基于以下销售数据进行分析,要求:

1. 数据概览:
   - 总销售额、平均订单金额
   - 最畅销产品类别
   - 用户增长趋势
   - 时间分布特征

2. 深度分析:
   - 销售高峰时段分析
   - 用户购买行为模式
   - 产品关联性分析
   - 地域分布特征

3. 可视化建议:
   - 销售趋势折线图
   - 产品类别饼图
   - 地域分布地图
   - 用户画像雷达图

4. 业务建议:
   - 营销策略建议
   - 产品优化方向
   - 库存管理建议
   - 用户体验改进

销售数据:
- 时间范围:2025年1月-2025年12月
- 总订单数:15,234
- 总销售额:3,456,789元
- 平均订单金额:227元
- 用户总数:8,456
- 产品类别:电子产品(45%)、服装(30%)、家居用品(25%)

请生成完整的分析报告,包含数据洞察和业务建议。
"""

专业的数据分析提示,支持深度分析和业务洞察

最佳实践一:提示设计原则

设计原则
  • 清晰明确
  • 结构化输出
  • 迭代优化
  • 测试验证

提示工程的核心设计原则

最佳实践二:提示模板库

模板库建设
  • 常见任务模板
  • 行业特定模板
  • 可复用组件

构建可复用的提示模板库

最佳实践三:持续改进

持续优化
  • 效果监控
  • A/B测试
  • 反馈循环

建立持续的提示改进机制

最佳实践四:团队协作

团队协作
  • 提示共享
  • 知识管理
  • 最佳实践传播

团队级的提示工程协作

总结:提示工程的核心价值

核心价值
  • 提升AI应用质量
  • 降低开发成本
  • 增强用户体验
  • 加速AI产品迭代

提示工程是AI应用开发的关键技能

参考资料

  • GitHub资源: https://github.com/amerob/ultimate-prompt-engineering-playbook
  • 参考文档: https://lushbinary.com/blog/advanced-prompt-engineering-techniques-developer-guide/

感谢阅读!
访问 https://atcfu.com/ai-articles/prompt-engineering/ 回顾本文