Agent 规格
AI Agent 规格 模式:受监督工作流 1. 任务目标 研究候选 AI 工具,检查 BotQNA 目录,并起草下一批建议。 2. 输入、工具和边界 - 可用工具:联网搜索、本地目录文件、浏览器 QA、可用时读取分析快照。 - 可以读取:[数据、文件、页面] - 可以起草:[报告、清单、补丁、消息草稿] - 不能直接执行:[外部发布、付费动作、删除、敏感传输] 3. 工作流 1. 读取上下文并确认目标。 2. 判断缺失信息是否会改变结果。 3. 使用最小必要工具收集证据。 4. 生成草稿、变更建议或验证报告。 5. 对风险动作等待审批,再继续。 4. 记忆与状态 - 短期状态:[本次任务上下文] - 长期状态:[只有确有必要时保存] - 不保存:[敏感输入或未经同意的数据] 5. 风险和审批 没有证据时不得发布页面、发送消息或宣称事实已核实。 6. 失败处理 - 工具失败:说明失败点并给降级路径。 - 证据不足:标记假设,不编造事实。 - 权限不足:停止副作用动作并请求授权。 7. 评估用例 | 场景 | 期望行为 | 失败信号 | | --- | --- | --- | | 信息完整 | 完成任务并给证据 | 只给空泛总结 | | 信息模糊 | 提出必要问题或写明假设 | 擅自补事实 | | 风险动作 | 等待审批 | 直接执行外部副作用 |
如何使用Agent 规格
步骤 1
明确 Agent 可以读取、起草、修改和绝不能做什么。
步骤 2
在外部副作用前先定义审批关卡。
步骤 3
为成功、模糊和失败场景写评估用例。
Example
Sample input
- Agent 任务
- 研究候选 AI 工具,检查 BotQNA 目录,并起草下一批建议。
- 工具或系统
- 联网搜索、本地目录文件、浏览器 QA、可用时读取分析快照。
- 风险和审批
- 没有证据时不得发布页面、发送消息或宣称事实已核实。
- Agent 模式
- 受监督工作流
Result preview
AI Agent 规格 模式:受监督工作流 1. 任务目标 研究候选 AI 工具,检查 BotQNA 目录,并起草下一批建议。 2. 输入、工具和边界 - 可用工具:联网搜索、本地目录文件、浏览器 QA、可用时读取分析快照。 - 可以读取:[数据、文件、页面] - 可以起草:[报告、清单、补丁、消息草稿] - 不能直接执行:[外部发布、付费动作、删除、敏感传输] 3. 工作流 1. 读取上下文并确认目标。 2. 判断缺失信息是否会改变结果。 3. 使用最小必要工具收集证据。 4. 生成草稿、变更建议或验证报告。 5. 对风险动作等待审批,再继续。 4. 记忆与状态 - 短期状态:[本次任务上下文] - 长期状态:[只有确有必要时保存] - 不保存:[敏感输入或未经同意的数据] 5. 风险和审批 没有证据时不得发布页面、发送消息或宣称事实已核实。 6. 失败处理 - 工具失败:说明失败点并给降级路径。 - 证据不足:标记假设,不编造事实。 - 权限不足:停止副作用动作并请求授权。 7. 评估用例 | 场景 | 期望行为 | 失败信号 | | --- | --- | --- | | 信息完整 | 完成任务并给证据 | 只给空泛总结 | | 信息模糊 | 提出必要问题或写明假设 | 擅自补事实 | | 风险动作 | 等待审批 | 直接执行外部副作用 |
常见问题
它会直接部署 Agent 吗?
不会。它先生成可审阅的规格,再决定是否实现或开放工具权限。
为什么要写审批关卡?
Agent 可能产生外部影响。审批关卡能让高风险动作可见且可控。