指令遵循
中等确保模型严格按照复杂指令行事
指令遵循
🟡 中等
挑战描述
在提示词工程中,确保 AI 准确理解并遵循复杂指令的能力至关重要。特别是在多步骤任务、特定格式要求或需要精确控制输出的场景下,指令遵循的质量直接影响结果。本挑战要求你设计一个提示词,使 AI 能够严格按照一系列复杂指令行事,即使这些指令看似矛盾或有特殊的执行顺序。
挑战目标
编写一个提示词,使 AI 能够:
- 准确理解多步骤、多条件的复杂指令
- 按照指定的优先级和顺序执行指令
- 在指令有不明确之处时做出合理的判断
- 完全遵循格式要求和输出限制
- 处理看似矛盾的指令(如有条件的规则例外)
要求
- 提示词必须包含清晰的指令层次和优先级
- 输出必须严格符合指定格式
- 指令中应包含一些特殊条件或例外情况
- 提示词应能指导 AI 在复杂场景中做出合理判断
- 任务完成后应有明确的验证机制
提示模板
[你的提示词]
任务: {任务描述}
测试案例
案例 1: 数据处理和格式化
任务: 分析以下文本,提取所有人名和对应的年龄。将结果按年龄从大到小排序,以JSON格式输出。对于没有明确提及年龄的人,假定其年龄为30岁。如果有多人年龄相同,则按姓名字母顺序排序。只包含实际出现在文本中的人名,不要推测。输出中不要包含任何解释或说明。
"张伟和他的妻子李娜(42岁)昨天参加了王刚的60岁生日派对。张伟比他妻子小5岁。王刚的女儿王小美也来了,她刚大学毕业。李娜的弟弟李强今年35岁,也是座上宾。"
案例 2: 条件文本生成
任务: 写一篇不超过200字的短文,主题是"人工智能的未来"。文章必须包含至少3个专业术语,每个术语首次出现时必须用括号做简短解释。不能使用"发展"、"技术"和"创新"这三个词。文章的每个段落首字母连起来必须能拼成"AI"。最后增加一个总结句,但不要使用"总之"、"总结"或"最后"等明显的总结标志词。
案例 3: 复杂规则应用
任务: 你是一个邮件分类助手。根据以下规则对邮件进行分类,并按指定格式回复:
规则1: 含有"urgent"、"asap"或"immediately"词语的邮件优先级为"高"
规则2: 来自域名以"company.com"结尾的邮件归类为"内部",其他为"外部"
规则3: 邮件正文超过100字的标记为"需要详细阅读"
规则4: 如果邮件同时符合规则1和来自CEO(邮箱ceo@company.com),则无论其他规则如何,都标记为"立即处理"
规则5: 包含附件的邮件添加标签"有附件"
输出格式必须为: [优先级] | [来源] | [标签1, 标签2, ...]
邮件:
From: manager@company.com
To: you@company.com
Subject: Quarterly Report Review
Attachments: report.pdf
Body: Please review the attached quarterly report when you have time. We'll discuss it in next week's meeting.
评分标准和自动测试方法
提示词将根据以下标准进行评分:
-
指令理解 (1分)
- 评估方法:检查AI是否正确理解所有指令方面
- 通过标准:展示对主要和次要要求的清晰理解
-
规则应用准确性 (1分)
- 评估方法:评估所有规则(包括例外)的正确应用
- 通过标准:按正确的优先顺序正确应用所有规则
-
格式合规性 (1分)
- 评估方法:验证严格遵守输出格式要求
- 通过标准:输出完全匹配指定格式,无偏差
-
边缘情况处理 (1分)
- 评估方法:测试AI如何处理模糊和特殊情况
- 通过标准:做出与指令意图一致的合理判断
-
指令优先级处理 (1分)
- 评估方法:检查AI是否正确优先处理冲突指令
- 通过标准:基于明确或隐含的优先级提示解决冲突
自动测试流程
- 对于每个测试案例,将您的提示词与指定任务作为输入使用
- 分析输出:
- 符合格式要求
- 正确应用规则和例外
- 准确处理边缘情况和模糊性
- 适当优先处理冲突指令
- 与每个测试案例的参考输出进行比较
- 计算最终得分(最高5分)
预期输出示例(针对案例1)
[
{"name": "王刚", "age": 60},
{"name": "李娜", "age": 42},
{"name": "李强", "age": 35},
{"name": "张伟", "age": 37},
{"name": "王小美", "age": 30}
]
解决方案讨论
提交你的解决方案,与社区分享你的思路和技巧!