Agent Memory 实战:记忆不是把所有聊天记录塞进上下文
“让 Agent 有记忆”听起来很自然,但很多实现方式其实很粗暴:把历史聊天记录总结一下,塞回 prompt;或者把所有对话做 embedding,查询时捞几段出来。短期能用,长期会变成一锅粥。记忆不是更多上下文,记忆是知道什么该留下、什么该忘掉、什么时候拿出来。 Cloudflare 最近推出 Agent Memory private beta,…
Responses API 实战:不要把 Agent 写成一串脆弱的 if else
很多人第一次做 AI Agent,会自然写出一串 if else:用户问搜索就调用搜索,用户问文件就读文件,用户问计算就丢给代码执行。这个写法能跑 demo,但很快会变成维护噩梦。工具越多,分支越多,异常越多,最后你维护的不是 Agent,而是一套脆弱的人工路由系统。 OpenAI Responses API 的方向很明确:把多工具调用放进一个 a…
Claude Code hooks 实战:把 AI 助手关进项目规则里
Claude Code 这类终端式 AI 编程工具真正有价值的地方,不是“它能聊天”,而是它能进入项目现场:读文件、跑命令、改代码、调用 MCP、执行 hooks。问题也随之出现:一个能动手的 AI,如果没有边界,就不是助手,而是一个很自信的实习生。 我的判断是:团队或个人项目要认真使用 Claude Code,第一步不是写更长的 prompt,而…
AI 编程助手开始按任务收费后,个人开发者该怎么控制成本
AI 编程助手过去像“编辑器里的增强补全”,现在越来越像“可以接任务的外包同事”。这个变化带来的第一个现实问题不是模型有多聪明,而是成本终于开始变得可见。GitHub 已经宣布 Copilot code review 从 2026 年 6 月 1 日起会同时消耗 AI Credits 和 GitHub Actions minutes,这意味着自动审…
Agent 产品的下一场竞争,不在模型层,而在“分发层”:为什么多平台 Chat SDK 值得独立开发者认真看
很多开发者做 Agent 产品时,默认入口还是网页:做个聊天框,接个模型,配几个工具,完事。这个阶段当然没错,但如果今天还把 Agent 的产品形态理解成“一个放在网站里的聊天机器人”,我觉得已经有点落后了。 越来越多团队开始意识到,Agent 要想真正被用起来,关键不是用户愿不愿意专门打开你的网站,而是它能不能出现在用户已经在工作的地方。Slac…
Durable Agent 开始成形:Agent 真正的难点,正在从“会不会调用工具”变成“能不能活得足够久”
过去一年,很多人谈 Agent,还停留在“能不能调 API”“会不会用工具”“会不会自己写代码”这个阶段。但真正做过线上产品的人都知道,Agent 一旦离开 demo,问题马上就变成另一套:任务跑一半断了怎么办,用户关掉页面怎么办,外部事件晚到十分钟怎么办,重试之后状态乱了怎么办。 所以我最近更关注的,不是哪个 Agent 框架又多了几个抽象,而是…
Codex App 真正值得关注的,不是“又一个 AI 编程工具”,而是多线程软件开发开始产品化
这两个月,AI 编程圈最不缺的新东西,就是“又一个会写代码的助手”。但如果只把 Codex App 看成 OpenAI 给 ChatGPT 套上的桌面壳子,那就有点低估它了。 我觉得它真正值得关注的点,不是模型更强,也不是界面更花,而是它把多线程软件开发这件事,第一次做成了一个普通开发者也能直接上手的产品:一个项目里并行跑多个线程、每个线程有独立上…
DeepSeek 给创业团队的启发:不是所有小团队都该学它,但都该学会它的取舍
DeepSeek 这家公司很容易被讲成一个爽文:一个中国小团队,用更低成本做出了接近顶级闭源模型的能力,然后让全球 AI 行业重新计算训练成本和开源策略。这个叙事有吸引力,但如果只停在“年轻人很强”“成本很低”“国产突破”,对创业团队其实帮助不大。 更值得拆的是:DeepSeek 到底是什么样的团队,它真正做成了什么,以及普通创业团队能从中学什么、…
Agent 安全不是安全团队的冷门话题,而是每个会接工具的开发者都要补的课
很多开发者在做 Agent 应用时,会把安全问题放到很后面:先把工具接起来,先让流程跑通,先做一个 demo。这个顺序可以理解,但不能长期这么做。只要 Agent 能读文件、调 API、改代码、访问网页,安全就不再是可选项。 GitHub 最近推出面向 agentic AI 漏洞的 Secure Code Game,并公开讨论 GitHub age…
AI 编程工具开始涨价并不意外:开发者该重新计算“便宜生产力”的账
AI 编程工具涨价、改套餐、限制高强度用量,很多人第一反应是失望。但从工程和商业角度看,这并不意外。过去一段时间,开发者享受到的 AI 编程体验,很大程度上建立在厂商补贴、模型成本下降预期和增长优先的策略上。 随着 agent 和 subagent 用法变多,单次请求不再只是生成几行代码,而是可能触发长时间推理、多轮工具调用、并行任务和测试执行。对…