提示词挑战

指令遵循

中等

确保模型严格按照复杂指令行事

指令遵循

🟡 中等

挑战描述

在提示词工程中,确保 AI 准确理解并遵循复杂指令的能力至关重要。特别是在多步骤任务、特定格式要求或需要精确控制输出的场景下,指令遵循的质量直接影响结果。本挑战要求你设计一个提示词,使 AI 能够严格按照一系列复杂指令行事,即使这些指令看似矛盾或有特殊的执行顺序。

挑战目标

编写一个提示词,使 AI 能够:

  1. 准确理解多步骤、多条件的复杂指令
  2. 按照指定的优先级和顺序执行指令
  3. 在指令有不明确之处时做出合理的判断
  4. 完全遵循格式要求和输出限制
  5. 处理看似矛盾的指令(如有条件的规则例外)

要求

  • 提示词必须包含清晰的指令层次和优先级
  • 输出必须严格符合指定格式
  • 指令中应包含一些特殊条件或例外情况
  • 提示词应能指导 AI 在复杂场景中做出合理判断
  • 任务完成后应有明确的验证机制

提示模板

[你的提示词]

任务: {任务描述}

测试案例

案例 1: 数据处理和格式化

任务: 分析以下文本,提取所有人名和对应的年龄。将结果按年龄从大到小排序,以JSON格式输出。对于没有明确提及年龄的人,假定其年龄为30岁。如果有多人年龄相同,则按姓名字母顺序排序。只包含实际出现在文本中的人名,不要推测。输出中不要包含任何解释或说明。

"张伟和他的妻子李娜(42岁)昨天参加了王刚的60岁生日派对。张伟比他妻子小5岁。王刚的女儿王小美也来了,她刚大学毕业。李娜的弟弟李强今年35岁,也是座上宾。"

案例 2: 条件文本生成

任务: 写一篇不超过200字的短文,主题是"人工智能的未来"。文章必须包含至少3个专业术语,每个术语首次出现时必须用括号做简短解释。不能使用"发展"、"技术"和"创新"这三个词。文章的每个段落首字母连起来必须能拼成"AI"。最后增加一个总结句,但不要使用"总之"、"总结"或"最后"等明显的总结标志词。

案例 3: 复杂规则应用

任务: 你是一个邮件分类助手。根据以下规则对邮件进行分类,并按指定格式回复:

规则1: 含有"urgent"、"asap"或"immediately"词语的邮件优先级为"高"
规则2: 来自域名以"company.com"结尾的邮件归类为"内部",其他为"外部"
规则3: 邮件正文超过100字的标记为"需要详细阅读"
规则4: 如果邮件同时符合规则1和来自CEO(邮箱ceo@company.com),则无论其他规则如何,都标记为"立即处理"
规则5: 包含附件的邮件添加标签"有附件"

输出格式必须为: [优先级] | [来源] | [标签1, 标签2, ...]

邮件:
From: manager@company.com
To: you@company.com
Subject: Quarterly Report Review
Attachments: report.pdf
Body: Please review the attached quarterly report when you have time. We'll discuss it in next week's meeting.

评分标准和自动测试方法

提示词将根据以下标准进行评分:

  1. 指令理解 (1分)

    • 评估方法:检查AI是否正确理解所有指令方面
    • 通过标准:展示对主要和次要要求的清晰理解
  2. 规则应用准确性 (1分)

    • 评估方法:评估所有规则(包括例外)的正确应用
    • 通过标准:按正确的优先顺序正确应用所有规则
  3. 格式合规性 (1分)

    • 评估方法:验证严格遵守输出格式要求
    • 通过标准:输出完全匹配指定格式,无偏差
  4. 边缘情况处理 (1分)

    • 评估方法:测试AI如何处理模糊和特殊情况
    • 通过标准:做出与指令意图一致的合理判断
  5. 指令优先级处理 (1分)

    • 评估方法:检查AI是否正确优先处理冲突指令
    • 通过标准:基于明确或隐含的优先级提示解决冲突

自动测试流程

  1. 对于每个测试案例,将您的提示词与指定任务作为输入使用
  2. 分析输出:
    • 符合格式要求
    • 正确应用规则和例外
    • 准确处理边缘情况和模糊性
    • 适当优先处理冲突指令
  3. 与每个测试案例的参考输出进行比较
  4. 计算最终得分(最高5分)

预期输出示例(针对案例1)

[
  {"name": "王刚", "age": 60},
  {"name": "李娜", "age": 42},
  {"name": "李强", "age": 35},
  {"name": "张伟", "age": 37},
  {"name": "王小美", "age": 30}
]

解决方案讨论

点击查看社区解决方案


提交你的解决方案,与社区分享你的思路和技巧!

提交你的解决方案

在这个版本中,暂不支持直接提交解决方案。你可以在本地编写你的解决方案,并在相应的挑战文件夹中创建一个新文件。