分类: 未分类

142 篇文章

代码审查 Agent 变强以后,小团队更要先定义“什么不能让它决定”
我对代码审查 Agent 的态度有点矛盾。一方面,它确实适合做很多人不愿意认真做的事:检查边界条件、扫一遍 diff、找明显的空指针、提醒测试没覆盖。另一方面,如果团队把它当成“自动 reviewer”,很快就会遇到一个更麻烦的问题:它可以发现问题,但不应该替你决定取舍。 Anthropic 在 Claude Code 相关更新里提到过专门的 re…
AI 编程工具开始省 token 之后,真正变贵的是上下文治理
我最近看 AI 编程工具的更新,越来越少关注“它又支持了什么模型”,反而更关注一个不太显眼的方向:它们开始认真处理上下文成本了。 GitHub Copilot 在 2026 年春季的一些更新里提到语义搜索、跨仓库 grep、prompt caching、deferred tool loading、面向 Agent 的专用工具。这些词听起来像产品细节…
MCP 继续往前走之后,个人开发者要关心的不是协议热度,而是状态和权限怎么收口
我原本以为 MCP 发展到 2026 年,主要矛盾会是“大家到底接不接这个协议”。现在看,这个阶段已经过去了。真正值得个人开发者关心的,不是再多接几个 MCP server,而是:当工具调用开始跨进程、跨服务、跨账号以后,状态放在哪里,权限怎么收口,失败怎么恢复。 这不是一个很性感的话题,但它决定了 MCP 能不能从演示项目变成可维护的生产组件。 …
“执行”正在变成 AI 产品的新接口,但别急着把所有应用都做成 Agent
过去大家和 AI 交互,核心还是“问一句,回一段”。现在越来越多产品在往另一个方向走:不是让模型只回答你,而是让它去执行、去调用工具、去推进一个任务。这当然是个重要变化,但我对它的判断并不狂热。因为“执行”变成接口,不等于所有应用都该立刻变成 Agent 产品。为什么这是一个真实变化当工具调用、文件读取、网页搜索、远程服务和运行时开始被统一到同一条…
Claude 4.7 这类更强编码模型出来之后,个人开发者更该重做工作流,而不是追 benchmark
每次有更强的编码模型发布,讨论总会很快滑向排行榜、分数和“谁又第一了”。这些信息当然有参考价值,但我越来越觉得,对个人开发者来说,真正重要的问题不是模型又涨了多少分,而是你的工作流有没有跟着升级。如果工作流没变,模型再强,很多收益最后也只会停留在“写得更快一点”。这不是没用,但远远没有到值得大惊小怪的程度。为什么我现在不太执着 benchmark因…
Copilot for Eclipse 开源这件事,对多数开发者的价值其实不是 Eclipse
看到“Copilot for Eclipse 开源”,很多人的第一反应可能是:我又不用 Eclipse,这跟我有什么关系?但我觉得这件事真正有价值的地方,恰恰不在 Eclipse,而在于它把一部分 AI 编程工具最不透明、最让人不放心的东西,往台面上拉了一步。为什么这件事值得写AI 编程工具这两年最常见的焦虑之一,就是“我看到了结果,但看不到它怎么…
给 Agent 一个浏览器很诱人,但先别忽略失败率和成本
“让 Agent 自己打开网页、点按钮、抓内容、完成流程”,这件事听起来太对了。谁不想把那些烦人的后台操作、表单填写、网页查找全自动外包出去?但我这段时间看下来,越发觉得给 Agent 一个浏览器当然值得关注,可它真正难的从来不是“能不能操作页面”,而是失败率、等待时间、环境稳定性和成本会不会把收益吃掉。为什么这个方向会热原因很简单。很多系统并没有…
远程 MCP 开始普及后,真正麻烦的不是接入,而是鉴权和边界
本地 MCP 好理解:工具跑在你机器上,权限、上下文、失败影响范围都相对直观。远程 MCP 一旦开始普及,事情就没那么简单了。很多演示会把注意力放在“终于能连远程服务了”,但我现在更在意的是另一件事:远程连接让工具更好用了,也让权限、身份、租户边界这些老问题重新变成主角。为什么这个变化值得注意远程 MCP 的意义当然很大。它让工具不必都本地安装,也…
GitHub Copilot coding agent 更新之后,我更愿意把它当成 backlog 工具
我对 GitHub Copilot coding agent 的态度,最近变得比一年前更实际了:不是更兴奋,而是更明确它适合干什么。如果让我用一句话概括,我会说:它现在更像一个适合处理 backlog 的后台工程助手,而不是一个可以替你做系统设计的自动程序员。为什么我会改这个判断过去大家对 coding agent 最大的担心,是它做出来的东西“能…
OpenAI Agents SDK 变得更像工程框架了,但个人开发者别先上多 Agent
我最近看一圈 Agent 框架,最大的感受不是“选择太多”,而是很多项目一上来就把多 Agent 协作当成默认形态,结果问题还没解决,复杂度先翻倍了。所以我对 OpenAI Agents SDK 现在的判断是:它已经越来越像一个认真做工程的框架了,但个人开发者别把重点放在“怎么上多 Agent”,而是先想清楚一个 Agent 加几条明确 hando…