我一开始以为,做 agentic coding 最烦的是模型会不会理解项目上下文。后来发现,更麻烦的问题其实是:你到底让它在什么边界里动手。 上下文不够,最多是改不对;运行边界不清,才会把事情真的搞乱。尤其是当工具开始能主动跑命令、改文件、串联多步操作以后,“权限提示太频繁”并不只是体验问题,它其实在提醒你:这件事本来就不该被轻易跳过。 为什么我觉…
我原本以为 AI 编程工具进入“agent 模式”以后,团队最先感受到的会是开发速度明显提升。后来我发现,很多仓库里先被放大的不是编码效率,而是审查效率。 原因不复杂:当工具还只是补全时,它主要影响一个人写代码的速度;当它开始自己起分支、改多文件、跑测试、做自检时,瓶颈就从“写得快不快”转成“你有没有能力把它审得明白”。如果审查链路没准备好,age…
我看到 GitHub Copilot 在 JetBrains 相关更新里支持全局自定义 Agent,可以把 .agent.md 放到 ~/.copilot/agents 下面,让多个工作区复用。第一反应是:这东西对个人开发者很方便。第二反应是:它也很容易变成新的配置债。 开发工具一旦支持“全局规则”,就会诱惑我们把所有个人偏好都写进去。短期确实省事…
很多人期待长任务编程 Agent,是因为它看起来能把“我想要一个功能”直接变成 PR。我对这个期待比较谨慎。Agent 能跑更久,能自己读文件、改代码、跑测试,当然是进步。但它越能自主执行,越暴露一个老问题:需求如果写得像聊天,最后就会得到一个像聊天一样含糊的实现。 OpenAI 在 Codex 相关技术文章里讲过 agent loop、工具调用、…
我对代码审查 Agent 的态度有点矛盾。一方面,它确实适合做很多人不愿意认真做的事:检查边界条件、扫一遍 diff、找明显的空指针、提醒测试没覆盖。另一方面,如果团队把它当成“自动 reviewer”,很快就会遇到一个更麻烦的问题:它可以发现问题,但不应该替你决定取舍。 Anthropic 在 Claude Code 相关更新里提到过专门的 re…
我最近看 AI 编程工具的更新,越来越少关注“它又支持了什么模型”,反而更关注一个不太显眼的方向:它们开始认真处理上下文成本了。 GitHub Copilot 在 2026 年春季的一些更新里提到语义搜索、跨仓库 grep、prompt caching、deferred tool loading、面向 Agent 的专用工具。这些词听起来像产品细节…
每隔一段时间,技术圈都会把同一个问题重新问一遍:AI 越来越强,未来还会有人手写代码吗?这个问题之所以总能引发讨论,不只是因为它吓人,而是因为它确实碰到了现实。过去两年,AI 编程已经从“帮你补几行代码”,走到“能读仓库、改多文件、跑测试、提 PR、接 issue、持续执行任务”。这不是噱头层面的升级,而是工作流层面的变化。但我先把结论摆在前面:未…
过去两年,大家对 AI 编程的熟悉路径大致是这样的:先是代码补全,再是对话式问答,然后是 IDE 里的 agent mode。很多人以为这已经差不多了,无非是模型越来越能写代码。可 2026 年更值得注意的变化,不是“写得更像人”,而是 AI 编程工具开始从实时协作走向任务委派。GitHub 最近围绕 Copilot coding agent 的连…
最近 Linux 内核项目给出了面向 AI Coding Assistants 的正式文档。很多人看到这个消息,第一反应可能是:连 Linux 内核都接受 AI 代码了,说明 AI 编程已经彻底进入主流。 但我看完文档后的感觉刚好相反:这份文件最重要的不是“接受”,而是“划线”。它真正表达的是,AI 可以参与,但责任、人类签署和法律归属不能外包。这…
过去一年,很多 AI 编程产品都还停留在“给编辑器加一个更聪明的对话框”。Cursor 3 这次不太一样。它公开表达的方向,已经不是让你在 IDE 里更高效地补全代码,而是把开发者往一个新的位置上推:从亲自敲每一行代码的人,变成同时调度多个 Agent、审查结果、决定取舍的人。 这也是我觉得这次更新值得写的原因。它不只是一个产品版本升级,而是在提醒…