工具推荐·阅读约 1 分钟·
shadcn/improve — 让最强的 AI 模型规划,让便宜的模型执行

shadcn/improve — 让最强的 AI 模型规划,让便宜的模型执行

shadcn 的新开源项目 improve 定义了一种全新的 AI 编码工作流:用你最强的模型(如 Claude Opus 4.6)审计代码库并制定详细执行计划,然后交给便宜的模型去执行。一个优雅的成本优化策略。

原文来源:shadcn/improve on GitHub — shadcn 发布开源工具 improve,实现"强模型规划,弱模型执行"的 AI 编码工作流,用 Agent Skill 的方式审计代码库并为廉价模型生成可行计划。

shadcn 又出手了。

这次不是 UI 组件库(虽然他的 shadcn/ui 已经改变了整个 React 生态的面貌)。他这次推出的开源项目叫做 improve,解决的是 AI 编程中一个非常实际的问题:为什么每次都要用最强(也最贵)的模型?

核心思路

improve 的理念可以用一句话概括:用你最强的模型审计代码库并撰写实现计划,然后交给更便宜的模型去执行。

这个模式借鉴了软件工程中的经典分工:架构师做设计,工程师写代码。在 improve 中:

  • 规划阶段:调用 Claude Opus 4.6、GPT-5 等高能力模型,全面分析代码库,理解现有架构和业务逻辑,然后生成详尽的实现计划(plans.md)
  • 执行阶段:将计划交给 Claude Sonnet 4.6、GPT-4o 等成本更低的模型,按计划逐步实施。由于计划够详细,弱模型几乎不需要自己做决策,只需要机械地执行

这种分离带来的好处显而易见:规划阶段的模型调用次数少但质量要求高,执行阶段的模型调用次数多但成本要求低。 整体下来,token 消耗成本可能降低 50-80%,同时最终质量仍然由强模型把关。

—— 广告 ——

技术实现

improve 以 Claude Code 的插件(plugin)形式工作。它本质上是一个 Agent Skill——一种可以被 AI 编程助手识别并自动使用的元技能。

当你把这个插件挂载到 Claude Code(或其他兼容的 AI 编码代理)中,工作流变成了:

  1. 开发者提出需求:比如"给 API 增加速率限制"
  2. improve 接管:启动规划模式,读取整个代码库的结构
  3. 强模型审计:Claude Opus 分析现有代码,评估改动影响范围,生成详细的 plans.md
  4. 开发者审核计划:确认计划可行后,approve
  5. 执行者接手:Claude Sonnet(或 Codex 等更便宜的模型)按照计划逐项实现
  6. 结果验证:计划完成后,强模型可以快速 review 最终结果

这个流程也考虑到了现实中的迭代需求——当执行过程中出现意外时,可以回到规划阶段重新评估。

为什么值得关注

成本优化是独立开发者最直接的受益点。如果你在日常开发中频繁使用 Claude Code 或 Copilot,每个月在 AI 编码上的开销可能不小。improve 的工作流可以让你把 80% 的 token 用在便宜的模型上,同时仍然享受顶级模型的架构审视力。

但更深层的价值在于质量。 很多 AI 编码工具的问题不是"写不出代码",而是"不理解上下文就仓促动工"。improve 强迫工作流进入"先理解、再计划、最后动手"的模式——这和人写代码的最佳实践如出一辙。

从架构角度看,improve 体现了一种更成熟的 AI 代理设计模式:将认知密集型任务(理解、分析、规划)与执行密集型任务(实现、测试、重构)分离。 这种"异质计算"(Heterogeneous Computing)的思路在 AI 代理领域正在成为一种趋势。

使用方式

improve 的使用非常简洁。在项目目录中安装插件后,你只需要对 Claude Code 说:

code
/improve "为这个 API 添加速率限制,使用令牌桶算法"

Claude Code 会自动调起 improve 工作流:先切入规划模式,用最强模型分析你的现有代码,生成计划,然后执行。整个过程透明可见,你可以随时介入调整计划。

这个项目发布后迅速在 GitHub 上获得了不少关注。作为一个开源工具,它展示了 AI 编码工具发展的一个可能方向:不是寻找一个万能模型,而是让不同模型在各自最擅长的位置上工作。

分享到
微博Twitter

© 2026 四月 · CC BY-NC-SA 4.0

原文链接:https://aprilzz.com/tools/shadcn-improve