Claude Code 这类终端式 AI 编程工具真正有价值的地方,不是“它能聊天”,而是它能进入项目现场:读文件、跑命令、改代码、调用 MCP、执行 hooks。问题也随之出现:一个能动手的 AI,如果没有边界,就不是助手,而是一个很自信的实习生。 我的判断是:团队或个人项目要认真使用 Claude Code,第一步不是写更长的 prompt,而…
AI 编程助手过去像“编辑器里的增强补全”,现在越来越像“可以接任务的外包同事”。这个变化带来的第一个现实问题不是模型有多聪明,而是成本终于开始变得可见。GitHub 已经宣布 Copilot code review 从 2026 年 6 月 1 日起会同时消耗 AI Credits 和 GitHub Actions minutes,这意味着自动审…
很多开发者做 Agent 产品时,默认入口还是网页:做个聊天框,接个模型,配几个工具,完事。这个阶段当然没错,但如果今天还把 Agent 的产品形态理解成“一个放在网站里的聊天机器人”,我觉得已经有点落后了。 越来越多团队开始意识到,Agent 要想真正被用起来,关键不是用户愿不愿意专门打开你的网站,而是它能不能出现在用户已经在工作的地方。Slac…
过去一年,很多人谈 Agent,还停留在“能不能调 API”“会不会用工具”“会不会自己写代码”这个阶段。但真正做过线上产品的人都知道,Agent 一旦离开 demo,问题马上就变成另一套:任务跑一半断了怎么办,用户关掉页面怎么办,外部事件晚到十分钟怎么办,重试之后状态乱了怎么办。 所以我最近更关注的,不是哪个 Agent 框架又多了几个抽象,而是…
这两个月,AI 编程圈最不缺的新东西,就是“又一个会写代码的助手”。但如果只把 Codex App 看成 OpenAI 给 ChatGPT 套上的桌面壳子,那就有点低估它了。 我觉得它真正值得关注的点,不是模型更强,也不是界面更花,而是它把多线程软件开发这件事,第一次做成了一个普通开发者也能直接上手的产品:一个项目里并行跑多个线程、每个线程有独立上…
DeepSeek 这家公司很容易被讲成一个爽文:一个中国小团队,用更低成本做出了接近顶级闭源模型的能力,然后让全球 AI 行业重新计算训练成本和开源策略。这个叙事有吸引力,但如果只停在“年轻人很强”“成本很低”“国产突破”,对创业团队其实帮助不大。 更值得拆的是:DeepSeek 到底是什么样的团队,它真正做成了什么,以及普通创业团队能从中学什么、…
很多开发者在做 Agent 应用时,会把安全问题放到很后面:先把工具接起来,先让流程跑通,先做一个 demo。这个顺序可以理解,但不能长期这么做。只要 Agent 能读文件、调 API、改代码、访问网页,安全就不再是可选项。 GitHub 最近推出面向 agentic AI 漏洞的 Secure Code Game,并公开讨论 GitHub age…
AI 编程工具涨价、改套餐、限制高强度用量,很多人第一反应是失望。但从工程和商业角度看,这并不意外。过去一段时间,开发者享受到的 AI 编程体验,很大程度上建立在厂商补贴、模型成本下降预期和增长优先的策略上。 随着 agent 和 subagent 用法变多,单次请求不再只是生成几行代码,而是可能触发长时间推理、多轮工具调用、并行任务和测试执行。对…
MCP 最早被很多人理解成“让大模型连接外部工具的协议”。这个理解没错,但已经不够了。最近 MCP 社区围绕 skills、apps、transport、conformance tests 的讨论,说明它正在变成更底层的东西:Agent 应用的边界定义方式。 这对开发者有实际意义。因为 Agent 应用一旦从玩具 demo 走向真实工作流,最大的问…
很多开发者第一次做 Agent 应用时,关心的是模型能不能调用工具。等真正上线以后,问题会变成另一个更朴素的版本:它调用得贵不贵,慢不慢,稳不稳。 OpenAI 最近在 Responses API 上提到几个值得注意的方向:工具搜索、长上下文压缩、计算机使用工具,以及通过 WebSocket 优化 agent 工作流的延迟。表面看是 API 功能更…