很多人期待长任务编程 Agent,是因为它看起来能把“我想要一个功能”直接变成 PR。我对这个期待比较谨慎。Agent 能跑更久,能自己读文件、改代码、跑测试,当然是进步。但它越能自主执行,越暴露一个老问题:需求如果写得像聊天,最后就会得到一个像聊天一样含糊的实现。 OpenAI 在 Codex 相关技术文章里讲过 agent loop、工具调用、…
我原本以为 MCP 发展到 2026 年,主要矛盾会是“大家到底接不接这个协议”。现在看,这个阶段已经过去了。真正值得个人开发者关心的,不是再多接几个 MCP server,而是:当工具调用开始跨进程、跨服务、跨账号以后,状态放在哪里,权限怎么收口,失败怎么恢复。 这不是一个很性感的话题,但它决定了 MCP 能不能从演示项目变成可维护的生产组件。 …
现在的 AI 编程工具开始提供模型选择:GitHub Copilot coding agent 支持 model picker,Claude、Codex、Copilot 等也越来越多地出现在同一个开发流程里。很多讨论会迅速滑向“哪个模型最强”。这个问题当然重要,但对个人开发者来说,更有用的问题是:什么任务该用什么模型,什么时候不值得用贵模型。 我的…
把 AI 编程助手接进 CI,是最近很多团队都会尝试的事。Claude Code 文档提到可以在 CI 中自动化 code review 和 issue triage,GitHub Copilot coding agent 也在往 PR、自审、安全扫描和 CLI handoff 方向走。趋势很清楚:AI 不只在编辑器里补代码,也会进入工程流水线。 …
AI 生成代码之后,下一步很自然就是“跑一下”。这也是最危险的地方。代码生成工具越强,越容易让人忘记一个基本事实:你并不知道它刚刚写出来的代码会做什么。尤其是当系统开始支持 shell、文件读写、网络请求和动态预览时,沙箱就不是锦上添花,而是底线。 Cloudflare Dynamic Workers 提到的一个典型场景,是让 AI 生成的应用在安…
Claude Code 这类终端式 AI 编程工具真正有价值的地方,不是“它能聊天”,而是它能进入项目现场:读文件、跑命令、改代码、调用 MCP、执行 hooks。问题也随之出现:一个能动手的 AI,如果没有边界,就不是助手,而是一个很自信的实习生。 我的判断是:团队或个人项目要认真使用 Claude Code,第一步不是写更长的 prompt,而…
AI 编程助手过去像“编辑器里的增强补全”,现在越来越像“可以接任务的外包同事”。这个变化带来的第一个现实问题不是模型有多聪明,而是成本终于开始变得可见。GitHub 已经宣布 Copilot code review 从 2026 年 6 月 1 日起会同时消耗 AI Credits 和 GitHub Actions minutes,这意味着自动审…
过去一年,关于“AI 生成代码到底能不能进生产、能不能进开源主干”的讨论,很多时候都被说得太虚。有人把它讲成效率神话,有人把它讲成版权灾难,还有人干脆把问题简化成“能不能用 Copilot”。Linux 内核最近给出的答案,反而是目前我看到最有工程味的一种:可以用,但别装作是工具在负责,责任还是你自己的。 内核文档已经新增了两份相关说明。一份是 A…
过去一年,很多人提到 MCP(Model Context Protocol)时,注意力都放在“模型终于能接外部工具了”。这当然重要,但到了 2026 年,我反而觉得这已经不是最值得看的部分。真正说明 MCP 进入下一阶段的信号,是它开始讨论传输扩展、代理通信、治理成熟和企业可用性。这意味着它正在从“开发者圈子里的方便协议”变成“需要被基础设施团队认…
很多团队提到 CI/CD,第一反应是“把测试和部署写进流水线”。这当然是基础,但如果只把它理解成几段自动化脚本,持续交付很快就会变成另一种形式的手工操作:脚本一堆、步骤很多、失败难排查、谁都不敢改。真正成熟的 CI/CD,不只是让系统自动跑起来,而是让交付过程可重复、可追踪、可治理。一、CI/CD 的目标不是更快,而是更稳地快很多组织推动 CI/C…