标签: AI工作流

4 篇文章

现在做 Agent,最容易被忽略的不是提示词,而是可回放的 traces 和最小 eval 集
我现在越来越不想讨论“提示词怎么写得更聪明”了。不是 prompt 不重要,而是很多 agent 项目一旦进入第二周,真正拖垮迭代速度的通常不是提示词,而是你根本不知道它上一次为什么成功、这一次为什么失败、换个模型以后到底退化了多少。 说得直接一点:没有 traces 和最小 eval 集,很多所谓的 agent 调优其实只是情绪化开发。今天觉得它…
AI 越来越强,未来还会有人手写代码吗?技术人员真正该迎接的不是“失业预言”,而是工作方式重组
每隔一段时间,技术圈都会把同一个问题重新问一遍:AI 越来越强,未来还会有人手写代码吗?这个问题之所以总能引发讨论,不只是因为它吓人,而是因为它确实碰到了现实。过去两年,AI 编程已经从“帮你补几行代码”,走到“能读仓库、改多文件、跑测试、提 PR、接 issue、持续执行任务”。这不是噱头层面的升级,而是工作流层面的变化。但我先把结论摆在前面:未…
Agent 已经能干活了,但大多数团队还没准备好治理:我为什么关注 Agent Governance Toolkit
这段时间,大家都在讨论怎么把 Agent 接进业务流程,怎么让它调用工具、访问 API、跑多步骤任务。但我越来越强烈的感受是:Agent 这件事,真正短缺的已经不是“能力”,而是“治理”。能做事的 Agent 越来越多,能被安全地放进真实环境里的 Agent 其实并不多。 所以微软 2026 年 4 月初开源 Agent Governance To…
真正可用的 Agent,不该一路弹权限框:为什么“先给计划,再批准执行”会越来越重要
我越来越觉得,Agent 产品接下来比拼的重点,不会只是模型够不够强,而是交互设计够不够靠谱。尤其是当 agent 能连续执行十几步、几十步操作时,最差的设计就是每走一步都弹一次确认框。表面上看这很安全,实际上很容易把人训练成机械点同意,最后既没有效率,也没有真正的控制感。 Anthropic 最近谈到 Claude Code 的一个方向,我觉得很…