这一年再看 Agent,热闹的部分已经不新鲜了。会调工具、会写代码、会多轮对话,这些能力大家都见过了。真正开始拉开差距的,不再是“它能不能做点事”,而是“它能不能把一件事稳定做完,而且中途出错后还能接着做”。 我越来越倾向于一个判断:2026 年值得投入的 Agent 方向,不是继续做一个更花哨的聊天入口,而是做可恢复、可观察、可拆分的任务流系统。…
实战:把一个串行 Agent 循环改造成低延迟执行器:Node.js + Responses API + WebSocket 如果你最近在做 coding agent、自动化修复脚本,或者任何“模型 + 工具调用 + 多轮继续”的应用,大概率已经感受过一个问题:模型本身不算慢,慢的是整条执行回路。一次任务里要读文件、跑命令、回传结果、继续推理,只要…
Assistants API 进入退场期后,独立开发者为什么该尽快把心智切到 Responses API 很多开发者做产品时有一个惯性:只要老接口还没彻底下线,就先不迁。这个习惯在一般业务系统里未必有问题,但在 AI 基础设施上,往往意味着你会持续把新能力挡在门外。最近 OpenAI 已经明确给出时间表:Assistants API 已被弃用,并计…
AI 编程的下一场竞争,不是谁更聪明,而是谁把“等待时间”干掉了 这两年大家讨论 AI 编程,最容易盯着模型能力看:代码补全更准了没有,复杂任务能不能一次做完,多文件修改会不会把项目搞坏。问题当然重要,但到了 2026 年,一个更现实的瓶颈已经浮出水面:很多时候,开发者感知到的“慢”,已经不主要来自模型不够聪明,而来自整条 agent 执行链路太笨…
过去一年,大家谈“上下文工程”时,很多人脑子里想的还是另一种提示词技巧:怎么写 system prompt,怎么塞背景,怎么让模型少跑偏。这个方向当然没错,但我越来越觉得,它已经不够了。真正重要的变化是:上下文开始从聊天窗口里的临时文本,变成仓库里的长期资产。这不是一个措辞变化,而是开发工作流正在发生迁移。Google 在 2025 年底介绍 Ge…
这两个月我越来越确定一件事:Agent 赛道真正拉开差距的地方,已经不是“模型会不会写代码”,而是你怎么把模型放进一个能持续工作的执行框架里。很多人到现在还把长任务 Agent 理解成“更长的 Prompt + 更多工具”。这个理解在做 demo 时还能凑合,一旦任务跨文件、跨步骤、跨小时,问题就会立刻暴露:上下文变脏、任务跑偏、自评失真、失败后无…
过去一段时间,MCP 几乎成了 AI 工具圈的公共语言。很多产品、框架、插件都在往 MCP 靠,官方规范也在继续推进,注册表、SDK 分层、MCP Apps 这类配套能力陆续补齐。热度是真的,但问题也来了:一热,大家就容易把它讲成“接上 MCP,AI 就万物互联”。这显然过头了。我的判断是,MCP 值得关注,而且是重度关注。但关注方式不是追着每个 …