很多人还在拿 Coding Agent 跟聊天式编程助手比较,我觉得这个比较已经开始过时了。2026 年真正值得注意的变化,不是它回答代码问题更快了,也不是补全更聪明了,而是越来越多产品开始把 Agent 从“你问一句它答一句”的前台助手,改造成可以被派单、排队、审查、回收结果的异步 Worker。为什么这件事比模型分数更重要因为这直接改变了开发工…
这两个月我越来越确定一件事:Agent 的 memory,正在从“锦上添花的功能点”变成一层真正的基础设施。很多人一提 memory,脑子里想到的还是“让机器人记住用户喜欢什么”。这当然算一种能力,但工程上更重要的,不是它会不会记住一句偏好,而是它能不能在多轮任务、跨会话协作、长周期执行里,维持一个可复用、可检索、可校正的上下文层。为什么现在这件事…
最近几个大平台都在把 Agent 能力往基础设施方向推。OpenAI 更新 Agents SDK,强调文件检查、命令执行、代码编辑和受控沙箱;Cloudflare 在 Agents Week 里连续推出 agentic cloud、Project Think、Agent Memory、AI Gateway 等能力。表面上看,这是大厂在堆平台。对个人…
现在的 AI 编程工具开始提供模型选择:GitHub Copilot coding agent 支持 model picker,Claude、Codex、Copilot 等也越来越多地出现在同一个开发流程里。很多讨论会迅速滑向“哪个模型最强”。这个问题当然重要,但对个人开发者来说,更有用的问题是:什么任务该用什么模型,什么时候不值得用贵模型。 我的…
把 AI 编程助手接进 CI,是最近很多团队都会尝试的事。Claude Code 文档提到可以在 CI 中自动化 code review 和 issue triage,GitHub Copilot coding agent 也在往 PR、自审、安全扫描和 CLI handoff 方向走。趋势很清楚:AI 不只在编辑器里补代码,也会进入工程流水线。 …
MCP 让 AI 工具连接外部数据源和工具变得更自然。Claude Code 文档里也明确提到可以通过 MCP 读取设计文档、更新 Jira、拉取 Slack 数据,或者接入自己的工具。对开发者来说,这很诱人:终于可以让 AI 不只是在代码仓库里猜,而是直接接触真实上下文。 但我的判断是:MCP 的第一课不是“怎么接更多工具”,而是“哪些工具绝对不…
AI 编程工具有一个很隐蔽的浪费:每换一个项目,你都要重新告诉它怎么写测试、怎么查日志、怎么发版、哪些目录不能碰。提示词写得越长,越像在反复培训一个永远不入职的同事。Agent Skills 的价值就在这里:把重复的工作方法沉淀成可复用技能。 GitHub CLI 已经推出 gh skill,用来发现、安装、管理和发布 agent skills。C…
AI 生成代码之后,下一步很自然就是“跑一下”。这也是最危险的地方。代码生成工具越强,越容易让人忘记一个基本事实:你并不知道它刚刚写出来的代码会做什么。尤其是当系统开始支持 shell、文件读写、网络请求和动态预览时,沙箱就不是锦上添花,而是底线。 Cloudflare Dynamic Workers 提到的一个典型场景,是让 AI 生成的应用在安…
“让 Agent 有记忆”听起来很自然,但很多实现方式其实很粗暴:把历史聊天记录总结一下,塞回 prompt;或者把所有对话做 embedding,查询时捞几段出来。短期能用,长期会变成一锅粥。记忆不是更多上下文,记忆是知道什么该留下、什么该忘掉、什么时候拿出来。 Cloudflare 最近推出 Agent Memory private beta,…
很多人第一次做 AI Agent,会自然写出一串 if else:用户问搜索就调用搜索,用户问文件就读文件,用户问计算就丢给代码执行。这个写法能跑 demo,但很快会变成维护噩梦。工具越多,分支越多,异常越多,最后你维护的不是 Agent,而是一套脆弱的人工路由系统。 OpenAI Responses API 的方向很明确:把多工具调用放进一个 a…