很多人现在用 AI 写代码,最大的问题不是生成能力不够,而是上下文太假。它知道当前文件,不知道整个仓库;它能改一段代码,不知道这个项目有哪些 issue、PR、分支和协作约束。结果就是:建议看着像对的,落到真实仓库里经常不够用。 这就是 GitHub MCP Server 值得实战试一遍的地方。它不是再给你一个聊天入口,而是把仓库、issue、pu…
过去大家评估 AI 编程工具,最常见的问题是:它能不能生成可用代码?这个问题在今天已经不够用了。到 2026 年,真正拉开差距的标准正在变化:谁能更稳定地接入现有仓库,谁能处理多文件修改,谁能运行测试、处理权限、接入 Git 工作流,谁就更接近真正的生产力工具。 这件事对开发者和独立开发者都很现实。因为“写出一段代码”和“把一个需求交付出去”中间,…
去年很多人提到 MCP,还主要把它当成一个“让模型调用外部工具的标准协议”。这话不算错,但太轻了。到了现在,MCP 更值得关注的地方已经不是它作为概念有多优雅,而是它开始进入真实工具链,正在从“协议讨论”走向“生态基础设施”。 这对开发者尤其重要。因为一旦一个协议开始被平台、IDE、托管服务和官方 server 共同推动,它的意义就不只是方便几次调…
过去一年,很多人谈 Agent,谈得像是在谈一种会自动完成工作的“数字员工”。但真正让 Agent 在 2026 年开始变得值得认真投入的,不是模型突然聪明到了某个临界点,而是围绕它的一整套工程基础终于开始成形:统一的响应接口、内建工具调用、可追踪的状态、可控的执行环境,以及更适合长流程任务的 SDK 抽象。 这件事为什么值得写?因为它意味着 Ag…
最近一波“龙虾系”产品很容易让人看花眼:OpenClaw、WorkBuddy、QClaw、EasyClaw,再加上阿里的悟空,看起来都在做“能替你干活的 AI Agent”,但它们其实并不处在同一个竞争层级。 如果你把它们当成五个完全平级的软件来比,大概率会越比越乱。因为这里面既有开源底座,也有面向个人的桌面代理产品,还有长在企业组织系统里的 AI…
终端里的 AI 工具这两年不少,但很多产品的问题也很一致:演示看起来很顺手,真正放进开发工作流之后,要么上下文太浅,要么只能当聊天壳子,要么一接入团队规范就开始失真。Kiro CLI 值得写,不是因为它“又一个 AI Coding 工具”,而是它在 CLI 里把几个真正影响长期可用性的能力拼起来了:会话持久化、Steering、Hooks、MCP,…
过去很长一段时间,很多所谓 Agent 框架给我的感觉都差不多:表面上在讲“智能体编排”,本质上还是把提示词、工具调用和一点状态管理缝在一起。能演示,能跑 demo,但离真正的工程执行环境还差一层东西。 OpenAI 2026 年 4 月更新 Agents SDK 之后,我第一次觉得这个方向开始更像“执行框架”而不是“提示词外壳”了。原因不是它又多…
这段时间,大家都在讨论怎么把 Agent 接进业务流程,怎么让它调用工具、访问 API、跑多步骤任务。但我越来越强烈的感受是:Agent 这件事,真正短缺的已经不是“能力”,而是“治理”。能做事的 Agent 越来越多,能被安全地放进真实环境里的 Agent 其实并不多。 所以微软 2026 年 4 月初开源 Agent Governance To…
过去一年,很多 AI 编程产品都还停留在“给编辑器加一个更聪明的对话框”。Cursor 3 这次不太一样。它公开表达的方向,已经不是让你在 IDE 里更高效地补全代码,而是把开发者往一个新的位置上推:从亲自敲每一行代码的人,变成同时调度多个 Agent、审查结果、决定取舍的人。 这也是我觉得这次更新值得写的原因。它不只是一个产品版本升级,而是在提醒…
很多人看 Codex,第一反应还是把它当成一个“OpenAI 也来做 AI 编程了”的产品补位。我觉得这个理解已经有点落后。最近的 Codex 更新、独立 app、并行线程、worktree、automations,以及面向不同任务的模型选择,透露出来的方向更像一个完整工作台:它不只是回答代码问题,而是试图承接从任务分发、执行到审阅的一整段流程。 …