OpenAI 在 2026 年 4 月更新 Agents SDK,把沙箱执行能力更正式地推到了台前。很多人看到这个消息时,会把它理解成“多了一个运行代码的环境”。我觉得这个理解偏浅了。这件事真正重要的地方在于:Agent 开发正在从“能调模型”走向“有完整执行基础设施”。也就是说,行业开始认真处理一个长期被 demo 掩盖的问题——模型要完成多步任…
过去一年,大家谈“上下文工程”时,很多人脑子里想的还是另一种提示词技巧:怎么写 system prompt,怎么塞背景,怎么让模型少跑偏。这个方向当然没错,但我越来越觉得,它已经不够了。真正重要的变化是:上下文开始从聊天窗口里的临时文本,变成仓库里的长期资产。这不是一个措辞变化,而是开发工作流正在发生迁移。Google 在 2025 年底介绍 Ge…
OpenAI 这几个月对 Codex 的推进,透露出的重点已经不是“把代码写得更快”这么简单了。2 月推出 Codex 桌面应用时,核心卖点是多 agent 并行、长任务协作;到 4 月的新版本,重点又继续往前推:它开始更深地接入开发者日常工具,能看多个文件和终端,能连远端 devbox,甚至把浏览器也拉进同一个工作流。这件事真正值得开发者关注的地…
很多人看 Codex,第一反应还是把它当成一个“OpenAI 也来做 AI 编程了”的产品补位。我觉得这个理解已经有点落后。最近的 Codex 更新、独立 app、并行线程、worktree、automations,以及面向不同任务的模型选择,透露出来的方向更像一个完整工作台:它不只是回答代码问题,而是试图承接从任务分发、执行到审阅的一整段流程。 …