标签: 工作流

8 篇文章

Claude 4.7 这类更强编码模型出来之后,个人开发者更该重做工作流,而不是追 benchmark
每次有更强的编码模型发布,讨论总会很快滑向排行榜、分数和“谁又第一了”。这些信息当然有参考价值,但我越来越觉得,对个人开发者来说,真正重要的问题不是模型又涨了多少分,而是你的工作流有没有跟着升级。如果工作流没变,模型再强,很多收益最后也只会停留在“写得更快一点”。这不是没用,但远远没有到值得大惊小怪的程度。为什么我现在不太执着 benchmark因…
Spec-driven development 看起来很慢,但它可能比“让 AI 直接写”更省返工
很多人用 AI 写代码,第一反应是直接把需求丢进去,然后期待它吐出一个能跑的结果。我自己试得越多,越觉得这种方式在小 demo 里很好,在真实项目里却很容易把返工提前透支掉。这也是我现在更看重 spec-driven development 的原因:它看起来慢,但它其实是在把那些原本会在 review、联调、回归阶段爆出来的问题,提前拉到最前面。它…
Agent Skills 实战:别让每个项目都重新教 AI 怎么工作
AI 编程工具有一个很隐蔽的浪费:每换一个项目,你都要重新告诉它怎么写测试、怎么查日志、怎么发版、哪些目录不能碰。提示词写得越长,越像在反复培训一个永远不入职的同事。Agent Skills 的价值就在这里:把重复的工作方法沉淀成可复用技能。 GitHub CLI 已经推出 gh skill,用来发现、安装、管理和发布 agent skills。C…
Claude Code hooks 实战:把 AI 助手关进项目规则里
Claude Code 这类终端式 AI 编程工具真正有价值的地方,不是“它能聊天”,而是它能进入项目现场:读文件、跑命令、改代码、调用 MCP、执行 hooks。问题也随之出现:一个能动手的 AI,如果没有边界,就不是助手,而是一个很自信的实习生。 我的判断是:团队或个人项目要认真使用 Claude Code,第一步不是写更长的 prompt,而…
Agent 产品的下一场竞争,不在模型层,而在“分发层”:为什么多平台 Chat SDK 值得独立开发者认真看
很多开发者做 Agent 产品时,默认入口还是网页:做个聊天框,接个模型,配几个工具,完事。这个阶段当然没错,但如果今天还把 Agent 的产品形态理解成“一个放在网站里的聊天机器人”,我觉得已经有点落后了。 越来越多团队开始意识到,Agent 要想真正被用起来,关键不是用户愿不愿意专门打开你的网站,而是它能不能出现在用户已经在工作的地方。Slac…
Codex App 真正值得关注的,不是“又一个 AI 编程工具”,而是多线程软件开发开始产品化
这两个月,AI 编程圈最不缺的新东西,就是“又一个会写代码的助手”。但如果只把 Codex App 看成 OpenAI 给 ChatGPT 套上的桌面壳子,那就有点低估它了。 我觉得它真正值得关注的点,不是模型更强,也不是界面更花,而是它把多线程软件开发这件事,第一次做成了一个普通开发者也能直接上手的产品:一个项目里并行跑多个线程、每个线程有独立上…
实战:用 Claude Code 的 hooks 和 subagents,搭一个更稳的本地开发流
现在很多人已经接受 AI 可以改代码,但真正让它进入日常工作流的,不是“它会不会写”,而是“它每次写完之后会不会把仓库搞乱”。这也是为什么我觉得 Claude Code 现在最值得实战看的,不只是改文件能力,而是 hooks 和 subagents 这两个更工程化的点。 前者让你在关键节点自动执行检查和清理动作,后者让你把不同类型任务拆给不同角色。…
AI 编程工具下一阶段,比拼的已经不是会不会写代码,而是谁更接近“可交付”
过去大家评估 AI 编程工具,最常见的问题是:它能不能生成可用代码?这个问题在今天已经不够用了。到 2026 年,真正拉开差距的标准正在变化:谁能更稳定地接入现有仓库,谁能处理多文件修改,谁能运行测试、处理权限、接入 Git 工作流,谁就更接近真正的生产力工具。 这件事对开发者和独立开发者都很现实。因为“写出一段代码”和“把一个需求交付出去”中间,…