Anthropic – 丸子运行中

现在做 Agent，最容易被忽略的不是提示词，而是可回放的 traces 和最小 eval 集

2026-6-03 0:24

|

120

|

0

1678 字

|

8 分钟

我现在越来越不想讨论“提示词怎么写得更聪明”了。不是 prompt 不重要，而是很多 agent 项目一旦进入第二周，真正拖垮迭代速度的通常不是提示词，而是你根本不知道它上一次为什么成功、这一次为什么失败、换个模型以后到底退化了多少。说得直接一点：没有 traces 和最小 eval 集，很多所谓的 agent 调优其实只是情绪化开发。今天觉得它…

Claude Code 开始更敢自动跳过权限之后，个人开发者更该把“运行边界”写死

2026-6-03 0:22

|

112

|

0

1670 字

|

8 分钟

我一开始以为，做 agentic coding 最烦的是模型会不会理解项目上下文。后来发现，更麻烦的问题其实是：你到底让它在什么边界里动手。上下文不够，最多是改不对；运行边界不清，才会把事情真的搞乱。尤其是当工具开始能主动跑命令、改文件、串联多步操作以后，“权限提示太频繁”并不只是体验问题，它其实在提醒你：这件事本来就不该被轻易跳过。为什么我觉…

Agent安全 AI编程 Anthropic Claude Claude Code 工程实践权限控制

很多团队以为自己在做 Skill，实际上只是在堆一个更长的 system prompt

2026-5-19 5:31

|

149

|

0

2371 字

|

10 分钟

我现在越来越不太相信很多团队嘴里的“我们已经把经验沉淀成 Skill 了”。不少时候，他们做的事情其实很简单：把原来聊天框里那段已经很长的 system prompt，挪进一个叫 SKILL.md、agent.md、workflow.md 的文件里，然后继续往里面堆规则、堆例外、堆工具说明、堆输出格式，最后给自己一种“我们已经工程化了”的幻觉。这…

Agent AI 工作流 Anthropic OpenAI Prompt Skill

Skill 不就是 prompt 换个壳吗？我为什么觉得这事不能只当营销话术看

2026-5-19 5:21

|

137

|

0

2048 字

|

9 分钟

我一开始也觉得，Skill 这套说法多少有点重新发明 prompt。你给模型一段更长的说明，附几份文档，再绑几个工具，不就差不多了吗？后来我看了一圈现在主流产品和文档，发现这件事确实有营销包装，但也不能简单归成“换个名字继续卖提示词”。真正被单独拿出来讲的，不是那一段自然语言本身，而是把一段可重复的做事方法，封装成可调用、可共享、可版本化、可维护的…

Agent AI 工作流 Anthropic OpenAI Prompt Skill

高级工具调用看起来让 Agent 更强，但很多系统真正先爆掉的是复杂度和成本

2026-5-07 8:40

|

199

|

0

1666 字

|

7 分钟

每次看到 Agent 工具调用能力增强，大家第一反应通常都是兴奋：能查网页了，能并行调工具了，能自动编排代码了，终于更像“会做事”的系统了。这个方向当然对，但我最近越来越强烈的感受是，很多系统不是先败在模型不够强，而是先败在工具调用把复杂度和成本一起放大。 Anthropic 在 2025 年底公开过 advanced tool use，提到 pr…

Agent AI 基础设施 AI 应用开发 Anthropic OpenAI

记忆和压缩开始变成 Agent 可靠性的基础设施，不做这一层系统迟早会发散

2026-5-07 8:39

|

145

|

0

1698 字

|

8 分钟

很多人提到 Agent 记忆，第一反应还是“让它记住用户偏好”或者“跨会话别忘事”。这当然有用，但我现在越来越觉得，这个理解已经不够了。真正决定 Agent 能不能长时间稳定工作、能不能跨多步任务继续推进的，不只是有没有记忆，而是你有没有把记忆和压缩当成一层基础设施来设计。 OpenAI 最新的 Cookbook 已经把 memory 和 comp…

Agent AI 基础设施 AI 工作流 Anthropic OpenAI

上下文工程开始变成新的维护成本，Agent 技能层也许比模型升级更值得投入

2026-5-07 8:31

|

151

|

0

1843 字

|

8 分钟

我原本以为，2026 年 Agent 这一波继续往前走，最值得追的是模型升级。后来越看越觉得不对。模型当然还在进步，但真正开始决定系统能不能长时间稳定工作的，越来越像是另一个层：上下文工程，以及围绕它长出来的技能层。 Anthropic 在 2025 年专门写了 Effective context engineering for AI agents…

Agent AI 编程 Anthropic Codex OpenAI

云端编码代理正在改写开发流程，但先别把它当成更强的 IDE 插件

2026-5-07 8:29

|

152

|

0

2112 字

|

9 分钟

我一开始以为，所谓云端编码代理，只是把 IDE 里的补全和对话面板搬到浏览器里。后来越看越觉得不是这么回事。真正的变化不在“能不能写代码”，而在它开始接管一整段原本需要人类持续盯着的工程流程：拉代码、看上下文、跑命令、修失败、继续尝试、最后给出可审阅结果。这件事为什么值得单独写？因为它意味着开发者工具正在从“交互式助手”变成“可持续运行的任务执行…

AI 工作流 AI 编程 Anthropic Claude Code Codex OpenAI

超长上下文不是 RAG 杀手：1M Token 背后真正变化的是知识接入成本

2026-4-24 21:18

|

185

|

0

2359 字

|

9 分钟

这两年只要模型上下文一变长，市场上就会周期性出现一种说法：RAG 要死了。现在上下文都到 1M 甚至更高了，文档直接全塞进去不就行了吗？这个说法听起来很顺，但工程上其实站不住。我的判断是：超长上下文会改变知识接入层的设计，但不会替代 RAG，它真正改变的是“接入成本曲线”而不是“信息检索的基本规律”。这不是抬杠，而是很多团队正在真实面对的架构问题…

AI 应用开发 Anthropic LLM RAG 知识库

MCP 不是万能插头：协议刚火起来，安全债已经追上来了

2026-4-22 23:33

|

183

|

0

1950 字

|

8 分钟

MCP 这半年很火，火到很多人已经默认它会成为 Agent 世界的“USB-C”。这个比喻传播很快，因为它足够顺口：统一接口、统一协议、统一生态，模型终于可以不再为每个工具写一套私有集成。问题是，工程世界里所有“万能插头”的故事，都有一个后半段：统一连接方式会降低接入成本，也会同步放大同一类设计缺陷的传播速度。最近安全研究团队公开披露的 MCP 相…

Agent安全 AI Anthropic MCP

标签： Anthropic