分类: 未分类

142 篇文章

Coding Agent 正在从聊天助手变成异步 Worker,这才是今年更大的变化
很多人还在拿 Coding Agent 跟聊天式编程助手比较,我觉得这个比较已经开始过时了。2026 年真正值得注意的变化,不是它回答代码问题更快了,也不是补全更聪明了,而是越来越多产品开始把 Agent 从“你问一句它答一句”的前台助手,改造成可以被派单、排队、审查、回收结果的异步 Worker。为什么这件事比模型分数更重要因为这直接改变了开发工…
Agent Memory 正在变成基础设施,不再只是一个“更聪明的聊天记录”
这两个月我越来越确定一件事:Agent 的 memory,正在从“锦上添花的功能点”变成一层真正的基础设施。很多人一提 memory,脑子里想到的还是“让机器人记住用户喜欢什么”。这当然算一种能力,但工程上更重要的,不是它会不会记住一句偏好,而是它能不能在多轮任务、跨会话协作、长周期执行里,维持一个可复用、可检索、可校正的上下文层。为什么现在这件事…
Agent 平台化之后,个人开发者真正能切入的机会在哪里
最近几个大平台都在把 Agent 能力往基础设施方向推。OpenAI 更新 Agents SDK,强调文件检查、命令执行、代码编辑和受控沙箱;Cloudflare 在 Agents Week 里连续推出 agentic cloud、Project Think、Agent Memory、AI Gateway 等能力。表面上看,这是大厂在堆平台。对个人…
多模型 Coding Agent 实战:别把模型选择当信仰问题
现在的 AI 编程工具开始提供模型选择:GitHub Copilot coding agent 支持 model picker,Claude、Codex、Copilot 等也越来越多地出现在同一个开发流程里。很多讨论会迅速滑向“哪个模型最强”。这个问题当然重要,但对个人开发者来说,更有用的问题是:什么任务该用什么模型,什么时候不值得用贵模型。 我的…
MCP 接入实战:工具越多,越要先设计权限边界
MCP 让 AI 工具连接外部数据源和工具变得更自然。Claude Code 文档里也明确提到可以通过 MCP 读取设计文档、更新 Jira、拉取 Slack 数据,或者接入自己的工具。对开发者来说,这很诱人:终于可以让 AI 不只是在代码仓库里猜,而是直接接触真实上下文。 但我的判断是:MCP 的第一课不是“怎么接更多工具”,而是“哪些工具绝对不…
Agent Skills 实战:别让每个项目都重新教 AI 怎么工作
AI 编程工具有一个很隐蔽的浪费:每换一个项目,你都要重新告诉它怎么写测试、怎么查日志、怎么发版、哪些目录不能碰。提示词写得越长,越像在反复培训一个永远不入职的同事。Agent Skills 的价值就在这里:把重复的工作方法沉淀成可复用技能。 GitHub CLI 已经推出 gh skill,用来发现、安装、管理和发布 agent skills。C…
AI 生成代码的沙箱实战:能运行不代表应该直接运行
AI 生成代码之后,下一步很自然就是“跑一下”。这也是最危险的地方。代码生成工具越强,越容易让人忘记一个基本事实:你并不知道它刚刚写出来的代码会做什么。尤其是当系统开始支持 shell、文件读写、网络请求和动态预览时,沙箱就不是锦上添花,而是底线。 Cloudflare Dynamic Workers 提到的一个典型场景,是让 AI 生成的应用在安…
Agent Memory 实战:记忆不是把所有聊天记录塞进上下文
“让 Agent 有记忆”听起来很自然,但很多实现方式其实很粗暴:把历史聊天记录总结一下,塞回 prompt;或者把所有对话做 embedding,查询时捞几段出来。短期能用,长期会变成一锅粥。记忆不是更多上下文,记忆是知道什么该留下、什么该忘掉、什么时候拿出来。 Cloudflare 最近推出 Agent Memory private beta,…
Responses API 实战:不要把 Agent 写成一串脆弱的 if else
很多人第一次做 AI Agent,会自然写出一串 if else:用户问搜索就调用搜索,用户问文件就读文件,用户问计算就丢给代码执行。这个写法能跑 demo,但很快会变成维护噩梦。工具越多,分支越多,异常越多,最后你维护的不是 Agent,而是一套脆弱的人工路由系统。 OpenAI Responses API 的方向很明确:把多工具调用放进一个 a…