Responses API 实战：不要把 Agent 写成一串脆弱的 if else

很多人第一次做 AI Agent，会自然写出一串 if else：用户问搜索就调用搜索，用户问文件就读文件，用户问计算就丢给代码执行。这个写法能跑 demo，但很快会变成维护噩梦。工具越多，分支越多，异常越多，最后你维护的不是 Agent，而是一套脆弱的人工路由系统。

OpenAI Responses API 的方向很明确：把多工具调用放进一个 agentic loop，让模型在一次请求里决定何时调用 web_search、file_search、image_generation、code interpreter、远程 MCP 或自定义函数。我的判断是，个人开发者做 Agent 产品时，应该尽早从“聊天接口思维”切到“任务执行接口思维”。

一个实战拆法

假设你要做一个“帮独立开发者分析项目日志并给出修复建议”的工具。老写法通常是：先让模型判断意图，再手动调用日志读取，再把结果塞回模型，再根据模型返回决定是否查文档。每一步都要你自己拼上下文、保存状态、处理失败。

更稳的做法是把工具声明清楚：read_logs 只读日志，query_docs 只查文档，run_check 只执行安全的诊断命令，create_patch 只生成补丁不直接部署。然后让 Responses API 在一次任务中组织这些工具。应用层负责边界，模型负责调度。

这里最关键的是工具命名和返回结构。不要写一个万能的 execute_action。工具越万能，越难审计。每个工具都应该有明确输入、明确输出、明确失败信息。Agent 系统最怕“看似灵活”，因为灵活通常意味着不可控。

踩坑：Agentic by default 不等于放弃控制

第一个坑是让模型决定业务权限。模型可以决定是否调用工具，但不能决定用户是否有权限调用工具。权限检查必须在服务端做，尤其是读取文件、访问客户数据、执行命令、发起支付这类动作。

第二个坑是没有记录工具调用链。Agent 出错时，如果你只保存最终回答，基本无法复盘。至少要记录用户任务、模型选择的工具、工具输入摘要、工具输出状态和最终结果。不是为了监控好看，而是为了你下次知道到底哪里坏了。

第三个坑是把 Agent 当同步接口用。长任务需要状态、取消、重试和结果通知。个人开发者最容易在这里偷懒，结果用户等了 40 秒，页面转圈，最后得到一句“任务失败”。Agent 产品不是聊天框，很多时候更像后台作业系统。

结论

Responses API 这类接口的价值，不是让你少写几行代码，而是把 Agent 的核心抽象从“消息回复”推进到“工具化任务执行”。值得个人开发者关注，但不要急着做全自动万能助手。先做一个边界很窄、工具很清楚、失败能复盘的小 Agent，比做一个什么都能说、什么都不可靠的大 Agent 更有机会活下来。

参考：OpenAI Responses API 迁移文档：https://developers.openai.com/api/docs/guides/migrate-to-responses

一个实战拆法

踩坑：Agentic by default 不等于放弃控制

结论

发送评论 编辑评论

推荐文章

发送评论编辑评论