分类: 未分类

142 篇文章

Claude Code hooks 实战:把 AI 助手关进项目规则里
Claude Code 这类终端式 AI 编程工具真正有价值的地方,不是“它能聊天”,而是它能进入项目现场:读文件、跑命令、改代码、调用 MCP、执行 hooks。问题也随之出现:一个能动手的 AI,如果没有边界,就不是助手,而是一个很自信的实习生。 我的判断是:团队或个人项目要认真使用 Claude Code,第一步不是写更长的 prompt,而…
AI 编程助手开始按任务收费后,个人开发者该怎么控制成本
AI 编程助手过去像“编辑器里的增强补全”,现在越来越像“可以接任务的外包同事”。这个变化带来的第一个现实问题不是模型有多聪明,而是成本终于开始变得可见。GitHub 已经宣布 Copilot code review 从 2026 年 6 月 1 日起会同时消耗 AI Credits 和 GitHub Actions minutes,这意味着自动审…
Agent 产品的下一场竞争,不在模型层,而在“分发层”:为什么多平台 Chat SDK 值得独立开发者认真看
很多开发者做 Agent 产品时,默认入口还是网页:做个聊天框,接个模型,配几个工具,完事。这个阶段当然没错,但如果今天还把 Agent 的产品形态理解成“一个放在网站里的聊天机器人”,我觉得已经有点落后了。 越来越多团队开始意识到,Agent 要想真正被用起来,关键不是用户愿不愿意专门打开你的网站,而是它能不能出现在用户已经在工作的地方。Slac…
Durable Agent 开始成形:Agent 真正的难点,正在从“会不会调用工具”变成“能不能活得足够久”
过去一年,很多人谈 Agent,还停留在“能不能调 API”“会不会用工具”“会不会自己写代码”这个阶段。但真正做过线上产品的人都知道,Agent 一旦离开 demo,问题马上就变成另一套:任务跑一半断了怎么办,用户关掉页面怎么办,外部事件晚到十分钟怎么办,重试之后状态乱了怎么办。 所以我最近更关注的,不是哪个 Agent 框架又多了几个抽象,而是…
Codex App 真正值得关注的,不是“又一个 AI 编程工具”,而是多线程软件开发开始产品化
这两个月,AI 编程圈最不缺的新东西,就是“又一个会写代码的助手”。但如果只把 Codex App 看成 OpenAI 给 ChatGPT 套上的桌面壳子,那就有点低估它了。 我觉得它真正值得关注的点,不是模型更强,也不是界面更花,而是它把多线程软件开发这件事,第一次做成了一个普通开发者也能直接上手的产品:一个项目里并行跑多个线程、每个线程有独立上…
DeepSeek 给创业团队的启发:不是所有小团队都该学它,但都该学会它的取舍
DeepSeek 这家公司很容易被讲成一个爽文:一个中国小团队,用更低成本做出了接近顶级闭源模型的能力,然后让全球 AI 行业重新计算训练成本和开源策略。这个叙事有吸引力,但如果只停在“年轻人很强”“成本很低”“国产突破”,对创业团队其实帮助不大。 更值得拆的是:DeepSeek 到底是什么样的团队,它真正做成了什么,以及普通创业团队能从中学什么、…
Agent 安全不是安全团队的冷门话题,而是每个会接工具的开发者都要补的课
很多开发者在做 Agent 应用时,会把安全问题放到很后面:先把工具接起来,先让流程跑通,先做一个 demo。这个顺序可以理解,但不能长期这么做。只要 Agent 能读文件、调 API、改代码、访问网页,安全就不再是可选项。 GitHub 最近推出面向 agentic AI 漏洞的 Secure Code Game,并公开讨论 GitHub age…
AI 编程工具开始涨价并不意外:开发者该重新计算“便宜生产力”的账
AI 编程工具涨价、改套餐、限制高强度用量,很多人第一反应是失望。但从工程和商业角度看,这并不意外。过去一段时间,开发者享受到的 AI 编程体验,很大程度上建立在厂商补贴、模型成本下降预期和增长优先的策略上。 随着 agent 和 subagent 用法变多,单次请求不再只是生成几行代码,而是可能触发长时间推理、多轮工具调用、并行任务和测试执行。对…
MCP 正在从“连接工具”变成“定义 Agent 应用边界”的协议
MCP 最早被很多人理解成“让大模型连接外部工具的协议”。这个理解没错,但已经不够了。最近 MCP 社区围绕 skills、apps、transport、conformance tests 的讨论,说明它正在变成更底层的东西:Agent 应用的边界定义方式。 这对开发者有实际意义。因为 Agent 应用一旦从玩具 demo 走向真实工作流,最大的问…
Responses API 的新变化说明了一件事:Agent 应用的瓶颈正在从“会不会调用工具”转向“调用得贵不贵”
很多开发者第一次做 Agent 应用时,关心的是模型能不能调用工具。等真正上线以后,问题会变成另一个更朴素的版本:它调用得贵不贵,慢不慢,稳不稳。 OpenAI 最近在 Responses API 上提到几个值得注意的方向:工具搜索、长上下文压缩、计算机使用工具,以及通过 WebSocket 优化 agent 工作流的延迟。表面看是 API 功能更…