AI 基础设施 – 丸子运行中

高级工具调用看起来让 Agent 更强，但很多系统真正先爆掉的是复杂度和成本

2026-5-07 8:40

|

167

|

0

1666 字

|

7 分钟

每次看到 Agent 工具调用能力增强，大家第一反应通常都是兴奋：能查网页了，能并行调工具了，能自动编排代码了，终于更像“会做事”的系统了。这个方向当然对，但我最近越来越强烈的感受是，很多系统不是先败在模型不够强，而是先败在工具调用把复杂度和成本一起放大。 Anthropic 在 2025 年底公开过 advanced tool use，提到 pr…

很多团队以为 Agent 能不能上线取决于模型，其实更早卡住的是治理层

2026-5-07 8:40

|

125

|

0

1485 字

|

7 分钟

我现在越来越觉得，很多 Agent 项目最后能不能上线，关键根本不在模型。模型当然重要，但它通常不是第一个把项目卡死的地方。更常见的现实是：团队刚把原型跑起来，接下来就被一连串更难回答的问题绊住——谁来审计？谁来兜底？错误动作怎么算？权限怎么切？出事后能不能还原发生了什么？ OpenAI 在 2026 年发布的《Building Governed …

Agent AI 基础设施 AI 工作流 Evals OpenAI

记忆和压缩开始变成 Agent 可靠性的基础设施，不做这一层系统迟早会发散

2026-5-07 8:39

|

121

|

0

1698 字

|

8 分钟

很多人提到 Agent 记忆，第一反应还是“让它记住用户偏好”或者“跨会话别忘事”。这当然有用，但我现在越来越觉得，这个理解已经不够了。真正决定 Agent 能不能长时间稳定工作、能不能跨多步任务继续推进的，不只是有没有记忆，而是你有没有把记忆和压缩当成一层基础设施来设计。 OpenAI 最新的 Cookbook 已经把 memory 和 comp…

Agent AI 基础设施 AI 工作流 Anthropic OpenAI

后台长任务会改变 Agent 产品形态，但别把异步执行想得太轻松

2026-5-07 8:30

|

117

|

0

1781 字

|

8 分钟

很多人第一次用 Agent 产品，会默认把它当成一个聊天界面：我发一句，你回一句，最好几十秒内结束。但只要任务开始碰到搜索、代码执行、远程工具、长链路推理，这种交互模型很快就不够用了。真正的问题不是模型能不能继续想，而是你的产品能不能承受一个任务跑十几分钟、几十分钟，甚至更久。这就是我最近特别关注 background mode 的原因。Open…

Agent AI 基础设施 AI 工作流 OpenAI Responses API

Durable Agent 开始成形：Agent 真正的难点，正在从“会不会调用工具”变成“能不能活得足够久”

2026-4-29 19:40

|

72

|

0

1494 字

|

6 分钟

过去一年，很多人谈 Agent，还停留在“能不能调 API”“会不会用工具”“会不会自己写代码”这个阶段。但真正做过线上产品的人都知道，Agent 一旦离开 demo，问题马上就变成另一套：任务跑一半断了怎么办，用户关掉页面怎么办，外部事件晚到十分钟怎么办，重试之后状态乱了怎么办。所以我最近更关注的，不是哪个 Agent 框架又多了几个抽象，而是…

Agent AI 基础设施 Vercel 开发工具自动化

MCP 正在从“连接工具”变成“定义 Agent 应用边界”的协议

2026-4-27 8:21

|

134

|

0

846 字

|

4 分钟

MCP 最早被很多人理解成“让大模型连接外部工具的协议”。这个理解没错，但已经不够了。最近 MCP 社区围绕 skills、apps、transport、conformance tests 的讨论，说明它正在变成更底层的东西：Agent 应用的边界定义方式。这对开发者有实际意义。因为 Agent 应用一旦从玩具 demo 走向真实工作流，最大的问…

Agent Framework AI 基础设施 MCP

Responses API 的新变化说明了一件事：Agent 应用的瓶颈正在从“会不会调用工具”转向“调用得贵不贵”

2026-4-27 8:21

|

123

|

0

777 字

|

3 分钟

很多开发者第一次做 Agent 应用时，关心的是模型能不能调用工具。等真正上线以后，问题会变成另一个更朴素的版本：它调用得贵不贵，慢不慢，稳不稳。 OpenAI 最近在 Responses API 上提到几个值得注意的方向：工具搜索、长上下文压缩、计算机使用工具，以及通过 WebSocket 优化 agent 工作流的延迟。表面看是 API 功能更…

Agent AI 基础设施 AI 应用开发

MCP 正在变成 AI 工具分发层：个人开发者现在该重仓什么，别碰什么

2026-4-24 21:17

|

157

|

0

2316 字

|

9 分钟

MCP 过去最容易被误解成一个“给大模型接工具的协议”。这句话不算错，但已经明显不够了。到 2026 年再看，MCP 更像是在从一个连接协议，慢慢长成一个工具生态的分发层。这件事对开发者的影响，比单纯“又多了一个标准”要大得多。我的判断是：MCP 现在值得重度关注，但不值得盲目铺摊子。它真正有价值的部分，不在于你能不能在两天里做出一个 MCP S…

Agent AI 基础设施 GitHub MCP 开源

AI 编程的下一场竞争，不是谁更聪明，而是谁把“等待时间”干掉了

2026-4-24 8:38

|

153

|

0

2252 字

|

9 分钟

AI 编程的下一场竞争，不是谁更聪明，而是谁把“等待时间”干掉了这两年大家讨论 AI 编程，最容易盯着模型能力看：代码补全更准了没有，复杂任务能不能一次做完，多文件修改会不会把项目搞坏。问题当然重要，但到了 2026 年，一个更现实的瓶颈已经浮出水面：很多时候，开发者感知到的“慢”，已经不主要来自模型不够聪明，而来自整条 agent 执行链路太笨…

AI 基础设施 AI 工作流 AI 编程 Codex OpenAI

Agent SDK 不再只是编排层：为什么 2026 年真正变化的是“执行环境回到平台”

2026-4-22 23:32

|

155

|

0

1823 字

|

7 分钟

过去一年，很多人都在聊 Agent，但大多数讨论其实停留在“怎么写一个多步调用循环”。这类讨论不算错，只是已经开始过时。2026 年一个更值得开发者重视的变化，不是又多了一个会调工具的框架，而是 Agent 基础设施正在往上收：编排、记忆、工具、状态管理、执行环境，开始被平台一起打包提供。OpenAI 最近更新 Agents SDK，把 long-…

Agent AI AI 基础设施 AI应用开发

标签： AI 基础设施