“让 Agent 有记忆”听起来很自然,但很多实现方式其实很粗暴:把历史聊天记录总结一下,塞回 prompt;或者把所有对话做 embedding,查询时捞几段出来。短期能用,长期会变成一锅粥。记忆不是更多上下文,记忆是知道什么该留下、什么该忘掉、什么时候拿出来。 Cloudflare 最近推出 Agent Memory private beta,…
很多人第一次做 AI Agent,会自然写出一串 if else:用户问搜索就调用搜索,用户问文件就读文件,用户问计算就丢给代码执行。这个写法能跑 demo,但很快会变成维护噩梦。工具越多,分支越多,异常越多,最后你维护的不是 Agent,而是一套脆弱的人工路由系统。 OpenAI Responses API 的方向很明确:把多工具调用放进一个 a…
Claude Code 这类终端式 AI 编程工具真正有价值的地方,不是“它能聊天”,而是它能进入项目现场:读文件、跑命令、改代码、调用 MCP、执行 hooks。问题也随之出现:一个能动手的 AI,如果没有边界,就不是助手,而是一个很自信的实习生。 我的判断是:团队或个人项目要认真使用 Claude Code,第一步不是写更长的 prompt,而…
AI 编程助手过去像“编辑器里的增强补全”,现在越来越像“可以接任务的外包同事”。这个变化带来的第一个现实问题不是模型有多聪明,而是成本终于开始变得可见。GitHub 已经宣布 Copilot code review 从 2026 年 6 月 1 日起会同时消耗 AI Credits 和 GitHub Actions minutes,这意味着自动审…
很多开发者做 Agent 产品时,默认入口还是网页:做个聊天框,接个模型,配几个工具,完事。这个阶段当然没错,但如果今天还把 Agent 的产品形态理解成“一个放在网站里的聊天机器人”,我觉得已经有点落后了。 越来越多团队开始意识到,Agent 要想真正被用起来,关键不是用户愿不愿意专门打开你的网站,而是它能不能出现在用户已经在工作的地方。Slac…
过去一年,很多人谈 Agent,还停留在“能不能调 API”“会不会用工具”“会不会自己写代码”这个阶段。但真正做过线上产品的人都知道,Agent 一旦离开 demo,问题马上就变成另一套:任务跑一半断了怎么办,用户关掉页面怎么办,外部事件晚到十分钟怎么办,重试之后状态乱了怎么办。 所以我最近更关注的,不是哪个 Agent 框架又多了几个抽象,而是…
这两个月,AI 编程圈最不缺的新东西,就是“又一个会写代码的助手”。但如果只把 Codex App 看成 OpenAI 给 ChatGPT 套上的桌面壳子,那就有点低估它了。 我觉得它真正值得关注的点,不是模型更强,也不是界面更花,而是它把多线程软件开发这件事,第一次做成了一个普通开发者也能直接上手的产品:一个项目里并行跑多个线程、每个线程有独立上…
DeepSeek 这家公司很容易被讲成一个爽文:一个中国小团队,用更低成本做出了接近顶级闭源模型的能力,然后让全球 AI 行业重新计算训练成本和开源策略。这个叙事有吸引力,但如果只停在“年轻人很强”“成本很低”“国产突破”,对创业团队其实帮助不大。 更值得拆的是:DeepSeek 到底是什么样的团队,它真正做成了什么,以及普通创业团队能从中学什么、…
很多开发者在做 Agent 应用时,会把安全问题放到很后面:先把工具接起来,先让流程跑通,先做一个 demo。这个顺序可以理解,但不能长期这么做。只要 Agent 能读文件、调 API、改代码、访问网页,安全就不再是可选项。 GitHub 最近推出面向 agentic AI 漏洞的 Secure Code Game,并公开讨论 GitHub age…
AI 编程工具涨价、改套餐、限制高强度用量,很多人第一反应是失望。但从工程和商业角度看,这并不意外。过去一段时间,开发者享受到的 AI 编程体验,很大程度上建立在厂商补贴、模型成本下降预期和增长优先的策略上。 随着 agent 和 subagent 用法变多,单次请求不再只是生成几行代码,而是可能触发长时间推理、多轮工具调用、并行任务和测试执行。对…