返回列表
中等
🟡
多模态处理
中等 • 提示词工程挑战
处理文本和图像的多模态信息
挑战描述
多模态处理是指同时处理文本、图像、音频等多种类型数据的能力。本挑战要求你设计一个提示词,使 AI 能够理解并处理包含多种模态信息的输入,进行跨模态的分析和推理。
挑战目标
编写一个提示词,使 AI 能够:
- 识别输入中的不同模态信息(文本、图像描述、音频描述等)
- 理解不同模态信息之间的关联和互补关系
- 基于多模态信息进行综合分析
- 生成跨模态的推理和结论
- 处理模态信息缺失或不一致的情况
要求
- 提示词必须能处理多种模态的组合输入
- 分析结果应体现多模态信息的综合理解
- 对于模态冲突,应能识别并合理处理
- 输出应包含对每个模态的分析和综合结论
- 处理过程应清晰可追溯
提示模板
[你的提示词]
输入内容:
文本: {文本内容}
图像描述: {图像描述}
音频描述: {音频描述}
任务: {具体任务}
自动测试流程
- 对每个测试用例,使用你的提示词作为输入
- 分析输出是否包含:
- 对各模态信息的单独分析
- 跨模态关联分析
- 综合结论
- 评估分析的准确性和深度
- 检查冲突处理的合理性
- 验证输出结构的清晰度
- 计算最终得分(满分10分)
期望输出示例 (针对案例1)
多模态分析结果:
## 各模态分析
**文本模态**: 用户对手机拍照功能评价积极,但对电池续航不满意
**图像模态**: 照片质量确实很高,色彩鲜艳,细节丰富,证实了拍照效果
**音频模态**: 拍照操作流畅,快门声清脆,说明相机响应良好
## 跨模态关联
- 图像模态支持了文本中对拍照功能的正面评价
- 音频模态进一步证实了相机操作的流畅性
- 三个模态信息在拍照功能方面高度一致
## 综合结论
用户对这款手机拍照功能的评价是准确的,照片质量确实优秀,操作体验良好。但电池续航问题确实存在,这是需要改进的地方。整体而言,这是一款拍照功能出色但续航有待提升的手机。
## 置信度: 90%
理由: 多模态信息高度一致,分析结果可靠。
提交你的解决方案,与社区分享你的思路和技巧!
编写你的 Prompt
根据题目要求,编写你的 AI 提示词
0 / 2000
提示词编写技巧
- 明确具体地表达你的需求
- 在需要时提供上下文和示例
- 根据受众使用适当的语气和风格
- 测试并迭代以改进结果
需要帮助?加入我们的社区
查看讨论