Agent – 丸子运行中

AI 编程 Agent 真正省下的不是写代码时间

2026-6-06 20:59

|

146

|

0

2022 字

|

9 分钟

我最近越来越少把 AI 编程工具当成“更聪明的自动补全”来看。这个判断可能有点反直觉。因为大多数人第一次用 Copilot、Claude Code、Codex 这类工具时，最直观的感受确实是：它能帮我写代码。写一个函数、补一段测试、改一个 CSS、生成一段 SQL，看起来都挺顺手。但如果你真的把它放进一个已有项目，而不是在空白文件里让它表演，问…

Agent AI 编程个人开发者开发工具技术文章

现在做 Agent，最容易被忽略的不是提示词，而是可回放的 traces 和最小 eval 集

2026-6-03 0:24

|

120

|

0

1678 字

|

8 分钟

我现在越来越不想讨论“提示词怎么写得更聪明”了。不是 prompt 不重要，而是很多 agent 项目一旦进入第二周，真正拖垮迭代速度的通常不是提示词，而是你根本不知道它上一次为什么成功、这一次为什么失败、换个模型以后到底退化了多少。说得直接一点：没有 traces 和最小 eval 集，很多所谓的 agent 调优其实只是情绪化开发。今天觉得它…

Agent AI工作流 Anthropic Evals OpenAI Traces 工程实践

我不太建议小团队一上来就做多 Agent，先把 Responses API 的“长任务外壳”搭对

2026-6-03 0:20

|

111

|

0

1659 字

|

8 分钟

我最近越来越不想看那种“多 Agent 协作架构图”了。不是因为它们完全没用，而是很多团队在真正跑起来之前，连最外层那层壳都没搭对：任务怎么启动，状态怎么收敛，工具怎么限权，日志怎么回放，失败后怎么继续。这个阶段谈一堆 Planner、Researcher、Reviewer，通常只是在给未来的维护成本提前贷款。这也是我为什么会重新看 OpenAI…

Agent Agents SDK AI应用开发 OpenAI Responses API 工程实践长任务

给 Agent 一个浏览器很诱人，但先别忽略失败率和成本

2026-5-26 9:20

|

106

|

0

858 字

|

4 分钟

“让 Agent 自己打开网页、点按钮、抓内容、完成流程”，这件事听起来太对了。谁不想把那些烦人的后台操作、表单填写、网页查找全自动外包出去？但我这段时间看下来，越发觉得给 Agent 一个浏览器当然值得关注，可它真正难的从来不是“能不能操作页面”，而是失败率、等待时间、环境稳定性和成本会不会把收益吃掉。为什么这个方向会热原因很简单。很多系统并没有…

Agent 浏览器自动化自动化

远程 MCP 开始普及后，真正麻烦的不是接入，而是鉴权和边界

2026-5-26 9:19

|

96

|

0

790 字

|

4 分钟

本地 MCP 好理解：工具跑在你机器上，权限、上下文、失败影响范围都相对直观。远程 MCP 一旦开始普及，事情就没那么简单了。很多演示会把注意力放在“终于能连远程服务了”，但我现在更在意的是另一件事：远程连接让工具更好用了，也让权限、身份、租户边界这些老问题重新变成主角。为什么这个变化值得注意远程 MCP 的意义当然很大。它让工具不必都本地安装，也…

Agent MCP 远程工具

OpenAI Agents SDK 变得更像工程框架了，但个人开发者别先上多 Agent

2026-5-26 9:18

|

54

|

0

929 字

|

4 分钟

我最近看一圈 Agent 框架，最大的感受不是“选择太多”，而是很多项目一上来就把多 Agent 协作当成默认形态，结果问题还没解决，复杂度先翻倍了。所以我对 OpenAI Agents SDK 现在的判断是：它已经越来越像一个认真做工程的框架了，但个人开发者别把重点放在“怎么上多 Agent”，而是先想清楚一个 Agent 加几条明确 hando…

Agent OpenAI 开发框架

背景编码 Agent 值得用，但别把核心架构改造交给它

2026-5-26 9:17

|

47

|

0

1011 字

|

4 分钟

我现在越来越愿意把背景编码 Agent 当成一个能消化 backlog 的工具，但我仍然不建议把核心架构改造、跨模块重构、关键业务规则迁移直接扔给它。原因不是它完全做不好，而是这类任务真正难的部分往往不在“写代码”，而在判断隐含约束、识别历史包袱、控制改动半径。这些地方，今天的 Agent 还远没有宣传里那么稳。为什么这个话题现在值得写过去一年里，…

Agent AI 编程开发效率

我为什么暂时不建议把 MCP 当成“万能插件接口”

2026-5-26 9:17

|

47

|

0

874 字

|

4 分钟

我一开始以为 MCP 最大的问题是协议本身不够成熟，后来发现真正麻烦的不是“能不能连上”，而是权限、状态和失败边界到底归谁管。这也是我现在不建议个人开发者把 MCP 当成“万能插件接口”的原因。它当然值得学，但更适合把它看成 Agent 世界里的工具接线层，而不是业务系统里的稳定扩展层。我为什么会关注它MCP 近一年的热度非常高，因为它确实在试图统…

Agent AI 工具 MCP

很多团队以为自己在做 Skill，实际上只是在堆一个更长的 system prompt

2026-5-19 5:31

|

148

|

0

2371 字

|

10 分钟

我现在越来越不太相信很多团队嘴里的“我们已经把经验沉淀成 Skill 了”。不少时候，他们做的事情其实很简单：把原来聊天框里那段已经很长的 system prompt，挪进一个叫 SKILL.md、agent.md、workflow.md 的文件里，然后继续往里面堆规则、堆例外、堆工具说明、堆输出格式，最后给自己一种“我们已经工程化了”的幻觉。这…

Agent AI 工作流 Anthropic OpenAI Prompt Skill

Skill 不就是 prompt 换个壳吗？我为什么觉得这事不能只当营销话术看

2026-5-19 5:21

|

135

|

0

2048 字

|

9 分钟

我一开始也觉得，Skill 这套说法多少有点重新发明 prompt。你给模型一段更长的说明，附几份文档，再绑几个工具，不就差不多了吗？后来我看了一圈现在主流产品和文档，发现这件事确实有营销包装，但也不能简单归成“换个名字继续卖提示词”。真正被单独拿出来讲的，不是那一段自然语言本身，而是把一段可重复的做事方法，封装成可调用、可共享、可版本化、可维护的…

Agent AI 工作流 Anthropic OpenAI Prompt Skill

标签： Agent