
Caveman(原始人)Claude Code 插件:用更少的词,省约 75% 的 Token
GitHub 上爆火的 Claude Code 插件——Caveman,通过让 AI 用原始人式的简短语言交流,大幅降低 token 消耗。安装即用,每分钟都在省钱。
原文来源:JuliusBrussee/caveman — 一个通过让 Claude 像原始人一样说话来节省约 75% 输出 Token 的 Claude Code 插件。支持 Claude Code、Codex、Gemini CLI、Cursor 等 40+ 种编码 Agent。
如果你每天都在用 Claude Code,一定对 token 消耗和账单金额深有体会。每次对话、每次代码修改都在燃烧 tokens,而很多 tokens 其实浪费在了不必要的语言组织上。
GitHub 上最近爆火的一个项目——Caveman——就用一个极其简单又极其有效的思路解决了这个问题:让 AI 像原始人一样说话。
为什么需要 Caveman
先用一下它自己的自我介绍来感受区别:
普通模式:"I'll analyze the codebase structure and identify the most efficient approach to implement the requested feature while maintaining consistency with existing patterns." (69 tokens)
Caveman 模式:"Look code. Find best way. Make feature. Keep style same." (19 tokens)
显然后者用更少的词表达了同样的意思。对于 AI 模型的 token 计价模式来说,这种差异直接转化为真金白银——输出 token 节省约 75%。
这个玩笑式的项目背后有一个严肃的观察:AI 模型输出的语言往往比实际需要的信息更冗长。 模型被训练得"礼貌"、"详尽"、"考虑周全"——而这些特质在编码场景中,大多是多余的。
—— 广告 ——
它是怎么工作的
Caveman 本质上是一个 Claude Code 插件(Plugin),遵循 Claude Code 的插件开发规范。它同时也作为 Codex 插件、Gemini CLI 扩展以及 40+ 种 Agent 的规则文件分发——通过一套统一的安装脚本覆盖所有主流编码 Agent。
安装后,它通过 CLAUDE.md 文件告诉 Claude:用尽量少的词交流,只在必要时提供细节。
具体效果(来自项目官方基准测试):
- 输出 token 节省约 75%
- 保持代码输出质量不变
- 不影响工具的调用能力
- 错误率没有明显变化
安装方式
方式一:一键安装脚本(推荐)
支持 macOS / Linux / WSL / Git Bash:
curl -fsSL https://raw.githubusercontent.com/JuliusBrussee/caveman/main/install.sh | bashWindows PowerShell:
irm https://raw.githubusercontent.com/JuliusBrussee/caveman/main/install.ps1 | iex这个安装脚本会自动检测你机器上的所有编码 Agent,并为每个 Agent 使用正确的安装方式(插件、规则文件或技能),一步到位。
方式二:仅安装到 Claude Code
如果你只想在 Claude Code 中使用,可以通过插件市场安装:
claude plugin marketplace add JuliusBrussee/caveman && claude plugin install caveman@caveman方式三:npm 全局安装
npm install -g @juliusbrussee/caveman-code安装后,Caveman 会自动激活。对于 Claude Code(以及 Gemini CLI)它会全局生效,每次会话自动启用。对于其他 Agent(如 Cursor、Cline、Windsurf),输入 /caveman 即可在当前会话启用,或使用 --with-init 参数使其始终保持激活。
适用场景
Caveman 特别适合以下场景:
日常编码——当你只需要代码,不需要 AI 的社交礼仪。写代码、改 bug、重构——这些任务的核心价值在输出,不在开场白。
批量处理——夜间运行 agent 处理大量任务时,token 消耗会快速累积。Caveman 的约 75% 节省在这种场景下效果尤其明显。
长时间对话——长 session 中,每次回复的 token 节省逐轮累积,最终效果远超单次节省的简单叠加。
成本敏感的项目——个人开发者或小团队可能对 Claude Code 的 token 账单比较敏感。Caveman 提供了一种零成本的优化方式。
注意事项
当然,Caveman 并非适用于所有场景:
- 文档生成——当你需要 AI 写出清晰的文档或注释时,原生的详尽表达更合适
- 教学场景——如果你在用 Claude 学习新技术,详细的解释仍然有价值
- 团队协作——如果 AI 的输出需要直接分享给其他人阅读,友好的语言风格更好
好消息是,Caveman 只是一个插件/规则,可以随时启用和禁用。需要节省 token 时打开,需要详细解释时关闭,互不干扰。
对行业的启示
Caveman 的走红(GitHub 上短时间内获得数千星)本身就是一个信号:开发者对 AI 工具的成本效率越来越在意。
在 AI 成本仍然相对高昂的现阶段,"用更少的话表达相同的信息"不再只是一个语言风格偏好,而是一个真实的生产力优化。这也反向说明,当前的 AI 模型在输出效率上还有很大的提升空间——如果 Caveman 都能省约 75%,那原生优化空间至少也在这个量级。
有开发者评论说:"这项目最妙的地方在于,它用一个笑话证明了一个严肃的事情。"确实,当 AI 工具进入大规模日常使用阶段,每一个 token 的效率都值得被认真对待。
© 2026 四月 · CC BY-NC-SA 4.0
原文链接:https://aprilzz.com/tools/caveman-claude-code-skill
相关文章
shadcn/improve — 让最强的 AI 模型规划,让便宜的模型执行
shadcn 的新开源项目 improve 定义了一种全新的 AI 编码工作流:用你最强的模型(如 Claude Opus 4.6)审计代码库并制定详细执行计划,然后交给便宜的模型去执行。一个优雅的成本优化策略。
Understand Anything:把你的代码库变成互动知识图谱
一个开源的 Claude Code 插件,用多 Agent 管道扫描你的项目,构建包含每个文件、函数、类和依赖的结构化知识图谱,并提供一个可供搜索和提问的交互式可视化仪表盘。15k+ GitHub Stars。
Headroom:开源上下文压缩层,让 AI Agent Token 消耗降低 60-95%
Headroom 是一个开源上下文压缩工具,通过智能压缩算法让 AI Agent 读取的提示词、工具输出、日志和 RAG 结果减少 60-95% 的 token,同时保持回答质量不下降。支持 Python/TS 库、代理模式、MCP 服务。