标签: Agent

50 篇文章

Agent 进入第二阶段:为什么 2026 年更值得做“可恢复任务流”,而不是聊天壳子
这一年再看 Agent,热闹的部分已经不新鲜了。会调工具、会写代码、会多轮对话,这些能力大家都见过了。真正开始拉开差距的,不再是“它能不能做点事”,而是“它能不能把一件事稳定做完,而且中途出错后还能接着做”。 我越来越倾向于一个判断:2026 年值得投入的 Agent 方向,不是继续做一个更花哨的聊天入口,而是做可恢复、可观察、可拆分的任务流系统。…
实战:把一个串行 Agent 循环改造成低延迟执行器:Node.js + Responses API + WebSocket
实战:把一个串行 Agent 循环改造成低延迟执行器:Node.js + Responses API + WebSocket 如果你最近在做 coding agent、自动化修复脚本,或者任何“模型 + 工具调用 + 多轮继续”的应用,大概率已经感受过一个问题:模型本身不算慢,慢的是整条执行回路。一次任务里要读文件、跑命令、回传结果、继续推理,只要…
AI 越来越强,未来还会有人手写代码吗?技术人员真正该迎接的不是“失业预言”,而是工作方式重组
每隔一段时间,技术圈都会把同一个问题重新问一遍:AI 越来越强,未来还会有人手写代码吗?这个问题之所以总能引发讨论,不只是因为它吓人,而是因为它确实碰到了现实。过去两年,AI 编程已经从“帮你补几行代码”,走到“能读仓库、改多文件、跑测试、提 PR、接 issue、持续执行任务”。这不是噱头层面的升级,而是工作流层面的变化。但我先把结论摆在前面:未…
AI 编程正在进入“委派时代”:Copilot Coding Agent 对独立开发者到底意味着什么
过去两年,大家对 AI 编程的熟悉路径大致是这样的:先是代码补全,再是对话式问答,然后是 IDE 里的 agent mode。很多人以为这已经差不多了,无非是模型越来越能写代码。可 2026 年更值得注意的变化,不是“写得更像人”,而是 AI 编程工具开始从实时协作走向任务委派。GitHub 最近围绕 Copilot coding agent 的连…
Agent SDK 不再只是编排层:为什么 2026 年真正变化的是“执行环境回到平台”
过去一年,很多人都在聊 Agent,但大多数讨论其实停留在“怎么写一个多步调用循环”。这类讨论不算错,只是已经开始过时。2026 年一个更值得开发者重视的变化,不是又多了一个会调工具的框架,而是 Agent 基础设施正在往上收:编排、记忆、工具、状态管理、执行环境,开始被平台一起打包提供。OpenAI 最近更新 Agents SDK,把 long-…
实战:用 OpenAI Agents SDK 搭一个可控的多 Agent 工作流,而不是一个会乱跑的 Demo
如果你最近在做 Agent,最容易踩的坑不是模型不够强,而是流程不受控。一个 agent 会查资料、会调用工具、会写文件,看起来很聪明;但一旦任务稍微变长,系统就会开始出现两个经典问题:一是上下文越跑越乱,二是失败之后你很难知道到底卡在哪一步。 这篇文章不聊空泛概念,直接给一个适合开发者上手的最小实战方向:用 OpenAI Agents SDK 搭…
Agent 真正开始变得可用,不是因为更聪明,而是因为更像一套可控的软件系统
过去一年,很多人谈 Agent,谈得像是在谈一种会自动完成工作的“数字员工”。但真正让 Agent 在 2026 年开始变得值得认真投入的,不是模型突然聪明到了某个临界点,而是围绕它的一整套工程基础终于开始成形:统一的响应接口、内建工具调用、可追踪的状态、可控的执行环境,以及更适合长流程任务的 SDK 抽象。 这件事为什么值得写?因为它意味着 Ag…
Agent SDK 开始内建沙箱,这不是功能补丁,而是 AI 开发基础设施开始成型
OpenAI 在 2026 年 4 月更新 Agents SDK,把沙箱执行能力更正式地推到了台前。很多人看到这个消息时,会把它理解成“多了一个运行代码的环境”。我觉得这个理解偏浅了。这件事真正重要的地方在于:Agent 开发正在从“能调模型”走向“有完整执行基础设施”。也就是说,行业开始认真处理一个长期被 demo 掩盖的问题——模型要完成多步任…
提示词不会消失,但它正在退居二线:为什么上下文工程正在从聊天技巧变成仓库资产
过去一年,大家谈“上下文工程”时,很多人脑子里想的还是另一种提示词技巧:怎么写 system prompt,怎么塞背景,怎么让模型少跑偏。这个方向当然没错,但我越来越觉得,它已经不够了。真正重要的变化是:上下文开始从聊天窗口里的临时文本,变成仓库里的长期资产。这不是一个措辞变化,而是开发工作流正在发生迁移。Google 在 2025 年底介绍 Ge…
别再把长任务 Agent 当成一个 Prompt:2026 年真正拉开差距的是 Harness
这两个月我越来越确定一件事:Agent 赛道真正拉开差距的地方,已经不是“模型会不会写代码”,而是你怎么把模型放进一个能持续工作的执行框架里。很多人到现在还把长任务 Agent 理解成“更长的 Prompt + 更多工具”。这个理解在做 demo 时还能凑合,一旦任务跨文件、跨步骤、跨小时,问题就会立刻暴露:上下文变脏、任务跑偏、自评失真、失败后无…