最近几个大平台都在把 Agent 能力往基础设施方向推。OpenAI 更新 Agents SDK,强调文件检查、命令执行、代码编辑和受控沙箱;Cloudflare 在 Agents Week 里连续推出 agentic cloud、Project Think、Agent Memory、AI Gateway 等能力。表面上看,这是大厂在堆平台。对个人…
MCP 让 AI 工具连接外部数据源和工具变得更自然。Claude Code 文档里也明确提到可以通过 MCP 读取设计文档、更新 Jira、拉取 Slack 数据,或者接入自己的工具。对开发者来说,这很诱人:终于可以让 AI 不只是在代码仓库里猜,而是直接接触真实上下文。 但我的判断是:MCP 的第一课不是“怎么接更多工具”,而是“哪些工具绝对不…
AI 编程工具有一个很隐蔽的浪费:每换一个项目,你都要重新告诉它怎么写测试、怎么查日志、怎么发版、哪些目录不能碰。提示词写得越长,越像在反复培训一个永远不入职的同事。Agent Skills 的价值就在这里:把重复的工作方法沉淀成可复用技能。 GitHub CLI 已经推出 gh skill,用来发现、安装、管理和发布 agent skills。C…
“让 Agent 有记忆”听起来很自然,但很多实现方式其实很粗暴:把历史聊天记录总结一下,塞回 prompt;或者把所有对话做 embedding,查询时捞几段出来。短期能用,长期会变成一锅粥。记忆不是更多上下文,记忆是知道什么该留下、什么该忘掉、什么时候拿出来。 Cloudflare 最近推出 Agent Memory private beta,…
很多人第一次做 AI Agent,会自然写出一串 if else:用户问搜索就调用搜索,用户问文件就读文件,用户问计算就丢给代码执行。这个写法能跑 demo,但很快会变成维护噩梦。工具越多,分支越多,异常越多,最后你维护的不是 Agent,而是一套脆弱的人工路由系统。 OpenAI Responses API 的方向很明确:把多工具调用放进一个 a…
很多开发者做 Agent 产品时,默认入口还是网页:做个聊天框,接个模型,配几个工具,完事。这个阶段当然没错,但如果今天还把 Agent 的产品形态理解成“一个放在网站里的聊天机器人”,我觉得已经有点落后了。 越来越多团队开始意识到,Agent 要想真正被用起来,关键不是用户愿不愿意专门打开你的网站,而是它能不能出现在用户已经在工作的地方。Slac…
过去一年,很多人谈 Agent,还停留在“能不能调 API”“会不会用工具”“会不会自己写代码”这个阶段。但真正做过线上产品的人都知道,Agent 一旦离开 demo,问题马上就变成另一套:任务跑一半断了怎么办,用户关掉页面怎么办,外部事件晚到十分钟怎么办,重试之后状态乱了怎么办。 所以我最近更关注的,不是哪个 Agent 框架又多了几个抽象,而是…
很多开发者第一次做 Agent 应用时,关心的是模型能不能调用工具。等真正上线以后,问题会变成另一个更朴素的版本:它调用得贵不贵,慢不慢,稳不稳。 OpenAI 最近在 Responses API 上提到几个值得注意的方向:工具搜索、长上下文压缩、计算机使用工具,以及通过 WebSocket 优化 agent 工作流的延迟。表面看是 API 功能更…
过去一年,AI 编程工具的叙事一直围绕“模型能力”:谁能写更多代码,谁能一次性修复更复杂的 bug,谁在 benchmark 上多赢几个百分点。但最近 GitHub、OpenAI、Anthropic 一系列面向开发者的动作提醒我们,AI 编程正在从模型竞赛进入工程期。 这个变化对开发者很重要。因为真正影响日常效率的,往往不是模型在理想题目上能不能答…
MCP 过去最容易被误解成一个“给大模型接工具的协议”。这句话不算错,但已经明显不够了。到 2026 年再看,MCP 更像是在从一个连接协议,慢慢长成一个工具生态的分发层。这件事对开发者的影响,比单纯“又多了一个标准”要大得多。 我的判断是:MCP 现在值得重度关注,但不值得盲目铺摊子。它真正有价值的部分,不在于你能不能在两天里做出一个 MCP S…