我一开始以为 MCP 最大的问题是协议本身,后来发现不是。协议反而是这件事里最容易的一部分。真正麻烦的,是当你的工具越来越多、模型越来越会主动调用工具之后,谁来决定它能调用什么、在什么上下文里调用、出了问题怎么追。 这也是我现在看 MCP 的核心判断:它当然值得关注,但对开发者来说,真正要投入时间的不是“再接几个 server”,而是尽快把权限边界…
过去一年做 AI 应用,很像在搭乐高:模型一层、工具调用一层、工作流编排一层、记忆层一层、聊天 UI 一层、部署和监控再来一层。能跑起来当然可以,但拼得越多,后面越像在维护自己的小型集成平台。最近一个很明显的趋势是:统一 AI 应用栈正在开始成形。无论是模型厂商往上做 agent 框架,还是应用平台往下包工具、状态、UI 和部署,大家都在做同一件事…
很多人还在拿 Coding Agent 跟聊天式编程助手比较,我觉得这个比较已经开始过时了。2026 年真正值得注意的变化,不是它回答代码问题更快了,也不是补全更聪明了,而是越来越多产品开始把 Agent 从“你问一句它答一句”的前台助手,改造成可以被派单、排队、审查、回收结果的异步 Worker。为什么这件事比模型分数更重要因为这直接改变了开发工…
这两个月我越来越确定一件事:Agent 的 memory,正在从“锦上添花的功能点”变成一层真正的基础设施。很多人一提 memory,脑子里想到的还是“让机器人记住用户喜欢什么”。这当然算一种能力,但工程上更重要的,不是它会不会记住一句偏好,而是它能不能在多轮任务、跨会话协作、长周期执行里,维持一个可复用、可检索、可校正的上下文层。为什么现在这件事…
最近几个大平台都在把 Agent 能力往基础设施方向推。OpenAI 更新 Agents SDK,强调文件检查、命令执行、代码编辑和受控沙箱;Cloudflare 在 Agents Week 里连续推出 agentic cloud、Project Think、Agent Memory、AI Gateway 等能力。表面上看,这是大厂在堆平台。对个人…
现在的 AI 编程工具开始提供模型选择:GitHub Copilot coding agent 支持 model picker,Claude、Codex、Copilot 等也越来越多地出现在同一个开发流程里。很多讨论会迅速滑向“哪个模型最强”。这个问题当然重要,但对个人开发者来说,更有用的问题是:什么任务该用什么模型,什么时候不值得用贵模型。 我的…
把 AI 编程助手接进 CI,是最近很多团队都会尝试的事。Claude Code 文档提到可以在 CI 中自动化 code review 和 issue triage,GitHub Copilot coding agent 也在往 PR、自审、安全扫描和 CLI handoff 方向走。趋势很清楚:AI 不只在编辑器里补代码,也会进入工程流水线。 …
MCP 让 AI 工具连接外部数据源和工具变得更自然。Claude Code 文档里也明确提到可以通过 MCP 读取设计文档、更新 Jira、拉取 Slack 数据,或者接入自己的工具。对开发者来说,这很诱人:终于可以让 AI 不只是在代码仓库里猜,而是直接接触真实上下文。 但我的判断是:MCP 的第一课不是“怎么接更多工具”,而是“哪些工具绝对不…
AI 编程工具有一个很隐蔽的浪费:每换一个项目,你都要重新告诉它怎么写测试、怎么查日志、怎么发版、哪些目录不能碰。提示词写得越长,越像在反复培训一个永远不入职的同事。Agent Skills 的价值就在这里:把重复的工作方法沉淀成可复用技能。 GitHub CLI 已经推出 gh skill,用来发现、安装、管理和发布 agent skills。C…
AI 生成代码之后,下一步很自然就是“跑一下”。这也是最危险的地方。代码生成工具越强,越容易让人忘记一个基本事实:你并不知道它刚刚写出来的代码会做什么。尤其是当系统开始支持 shell、文件读写、网络请求和动态预览时,沙箱就不是锦上添花,而是底线。 Cloudflare Dynamic Workers 提到的一个典型场景,是让 AI 生成的应用在安…