标签: AI 基础设施

11 篇文章

高级工具调用看起来让 Agent 更强,但很多系统真正先爆掉的是复杂度和成本
每次看到 Agent 工具调用能力增强,大家第一反应通常都是兴奋:能查网页了,能并行调工具了,能自动编排代码了,终于更像“会做事”的系统了。这个方向当然对,但我最近越来越强烈的感受是,很多系统不是先败在模型不够强,而是先败在工具调用把复杂度和成本一起放大。 Anthropic 在 2025 年底公开过 advanced tool use,提到 pr…
很多团队以为 Agent 能不能上线取决于模型,其实更早卡住的是治理层
我现在越来越觉得,很多 Agent 项目最后能不能上线,关键根本不在模型。模型当然重要,但它通常不是第一个把项目卡死的地方。更常见的现实是:团队刚把原型跑起来,接下来就被一连串更难回答的问题绊住——谁来审计?谁来兜底?错误动作怎么算?权限怎么切?出事后能不能还原发生了什么? OpenAI 在 2026 年发布的《Building Governed …
记忆和压缩开始变成 Agent 可靠性的基础设施,不做这一层系统迟早会发散
很多人提到 Agent 记忆,第一反应还是“让它记住用户偏好”或者“跨会话别忘事”。这当然有用,但我现在越来越觉得,这个理解已经不够了。真正决定 Agent 能不能长时间稳定工作、能不能跨多步任务继续推进的,不只是有没有记忆,而是你有没有把记忆和压缩当成一层基础设施来设计。 OpenAI 最新的 Cookbook 已经把 memory 和 comp…
后台长任务会改变 Agent 产品形态,但别把异步执行想得太轻松
很多人第一次用 Agent 产品,会默认把它当成一个聊天界面:我发一句,你回一句,最好几十秒内结束。但只要任务开始碰到搜索、代码执行、远程工具、长链路推理,这种交互模型很快就不够用了。真正的问题不是模型能不能继续想,而是你的产品能不能承受一个任务跑十几分钟、几十分钟,甚至更久。 这就是我最近特别关注 background mode 的原因。Open…
Durable Agent 开始成形:Agent 真正的难点,正在从“会不会调用工具”变成“能不能活得足够久”
过去一年,很多人谈 Agent,还停留在“能不能调 API”“会不会用工具”“会不会自己写代码”这个阶段。但真正做过线上产品的人都知道,Agent 一旦离开 demo,问题马上就变成另一套:任务跑一半断了怎么办,用户关掉页面怎么办,外部事件晚到十分钟怎么办,重试之后状态乱了怎么办。 所以我最近更关注的,不是哪个 Agent 框架又多了几个抽象,而是…
MCP 正在从“连接工具”变成“定义 Agent 应用边界”的协议
MCP 最早被很多人理解成“让大模型连接外部工具的协议”。这个理解没错,但已经不够了。最近 MCP 社区围绕 skills、apps、transport、conformance tests 的讨论,说明它正在变成更底层的东西:Agent 应用的边界定义方式。 这对开发者有实际意义。因为 Agent 应用一旦从玩具 demo 走向真实工作流,最大的问…
Responses API 的新变化说明了一件事:Agent 应用的瓶颈正在从“会不会调用工具”转向“调用得贵不贵”
很多开发者第一次做 Agent 应用时,关心的是模型能不能调用工具。等真正上线以后,问题会变成另一个更朴素的版本:它调用得贵不贵,慢不慢,稳不稳。 OpenAI 最近在 Responses API 上提到几个值得注意的方向:工具搜索、长上下文压缩、计算机使用工具,以及通过 WebSocket 优化 agent 工作流的延迟。表面看是 API 功能更…
MCP 正在变成 AI 工具分发层:个人开发者现在该重仓什么,别碰什么
MCP 过去最容易被误解成一个“给大模型接工具的协议”。这句话不算错,但已经明显不够了。到 2026 年再看,MCP 更像是在从一个连接协议,慢慢长成一个工具生态的分发层。这件事对开发者的影响,比单纯“又多了一个标准”要大得多。 我的判断是:MCP 现在值得重度关注,但不值得盲目铺摊子。它真正有价值的部分,不在于你能不能在两天里做出一个 MCP S…
AI 编程的下一场竞争,不是谁更聪明,而是谁把“等待时间”干掉了
AI 编程的下一场竞争,不是谁更聪明,而是谁把“等待时间”干掉了 这两年大家讨论 AI 编程,最容易盯着模型能力看:代码补全更准了没有,复杂任务能不能一次做完,多文件修改会不会把项目搞坏。问题当然重要,但到了 2026 年,一个更现实的瓶颈已经浮出水面:很多时候,开发者感知到的“慢”,已经不主要来自模型不够聪明,而来自整条 agent 执行链路太笨…
Agent SDK 不再只是编排层:为什么 2026 年真正变化的是“执行环境回到平台”
过去一年,很多人都在聊 Agent,但大多数讨论其实停留在“怎么写一个多步调用循环”。这类讨论不算错,只是已经开始过时。2026 年一个更值得开发者重视的变化,不是又多了一个会调工具的框架,而是 Agent 基础设施正在往上收:编排、记忆、工具、状态管理、执行环境,开始被平台一起打包提供。OpenAI 最近更新 Agents SDK,把 long-…