cavemanでClaude Codeのトークンを75%削減|AIコーディングエージェントを穴居人モードにする方法
「Claude Codeに質問するたびにトークンがみるみる消えていく……」
そんな悩みを抱えるエンジニアに朗報です。⭐47,000超のスターを集めているOSSスキル「caveman」を使えば、AIコーディングエージェントの出力トークンを最大75%削減できます。
しかも技術的な正確さは100%維持したまま。まるで「無駄な言葉をすべて削ぎ落とした穴居人のような回答」をAIが返してくれるようになります。
この記事では、cavemanの仕組みからインストール手順、実際のBefore/Afterまで丸ごと解説します。
穴居人、現る。AIコーディングエージェントを「洞窟語」で話させる
cavemanは、Claude Code・Cursor・Codex・Gemini CLIなどのAIコーディングエージェントに「穴居人モード」を適用するスキルです。
通常、AIは丁寧で冗長な文章で回答します。「〜ということをご理解いただいた上で、具体的には……」みたいなやつです。
cavemanはそれを根絶します。AIに「ウーガ、コードある。直す。」くらいの簡潔さで答えさせることで、出力トークンを~75%削減します。
なぜそれが可能かというと、cavemanはプロンプトの構造自体を最適化し、AIが本当に必要な情報だけを返すよう指示するからです。arxivの研究でも実証されており、技術的な正確さが損なわれることはありません。
いわば「賢い穴居人」。語彙は少ないが、知識は一流というわけです。
Before/Afterで見る「穴居人効果」:69トークン→19トークンの衝撃
実際にどう変わるか、公式のBefore/Afterを見てみましょう。
お題:「Reactコンポーネントが不必要に再レンダリングされる原因は?」
通常のClaude(69トークン)
Reactコンポーネントが再レンダリングされているのは、各レンダリングサイクルで
新しいオブジェクト参照を作成しているためです。インラインオブジェクトをpropと
して渡すと、Reactはそれを毎回新しい値として認識してしまい、結果として不要な
再レンダリングが発生します。これを防ぐには、useMemoフックを使用して……
穴居人Claude(19トークン)
新オブジェクト参照→再レンダリング。インラインobject prop→毎回new ref。useMemoで囲む。
伝わってますよね?完全に。むしろ速攻で理解できる。
69トークン→19トークンなので、削減率は72.5%です。公式の「最大75%削減」は誇大広告でも何でもなく、普通に達成できる数字です。
トークン削減がコストと速度に与える影響を数字で見る
「トークン削減ってそんなに大事?」と思う方のために、コストと速度への影響を整理します。
コスト削減の試算
Claude Sonnet 4.6の出力トークン単価を$3.00/1Mトークンとして計算します。
| 条件 | 月間出力トークン | 月額コスト |
|---|---|---|
| caveman未使用 | 1,000,000トークン | $3.00 |
| caveman使用(75%削減) | 250,000トークン | $0.75 |
月$2.25の節約。年間にすると$27。Claude Codeをヘビーに使っているなら、削減率はさらに大きくなります。
公式によるとコスト削減率は約71%。Output tokenはInput tokenより高額なモデルが多いため、出力を削れるインパクトは非常に大きいです。
速度への影響
出力トークンが75%減るということは、AIが生成する文字数も75%減ります。つまりレスポンス速度は約3〜4倍に向上します。
ストリーミング出力でダラダラ文章が流れてくるのを待つストレスが激減するのも地味に嬉しいポイントです。
また、caveman-compressコマンドを使えば入力トークンも約46%削減できます。プロンプト自体を圧縮することで、Input/Output両面でコストを抑えられます。
ちなみに、Claude CodeをVPSで運用しているなら ConoHa VPS(月額最安クラスのVPS) がコスパ良くておすすめです。常時起動のサーバーでClaude Code + cavemanを走らせれば、クラウドAI費用をさらに最適化できます。
Claude Code・Cursor・Gemini CLIへのインストール手順
インストールはワンライナーで完了します。
Claude Code
claude plugin marketplace add JuliusBrussee/caveman && claude plugin install caveman@caveman
Cursor
npx skills add JuliusBrussee/caveman -a cursor
Windsurf
npx skills add JuliusBrussee/caveman -a windsurf
Gemini CLI
gemini extensions install https://github.com/JuliusBrussee/caveman
その他全般(汎用)
npx skills add JuliusBrussee/caveman
インストール後はエージェントに /caveman と入力するだけで穴居人モードが有効になります。
CopilotとCursorの比較を検討しているなら、どちらのエージェントでもcavemanは動作するため、ツール選定の際の差別化要素にはなりません。どちらを選んでも同じコスト削減効果が得られます。
4つのレベルと便利コマンドを使いこなす
cavemanには4段階の「穴居人レベル」と、専用の便利コマンドがあります。
穴居人レベル
| コマンド | レベル | 特徴 |
|---|---|---|
/caveman lite |
ライト | 少しだけ簡潔に |
/caveman(デフォルト) |
通常 | バランス型・最もおすすめ |
/caveman full |
フル | かなり削ぎ落とす |
/caveman ultra |
ウルトラ | 限界まで簡潔に |
/caveman 文言文 |
文言文(古典中国語) | 最強の簡潔さ(上級者向け) |
「文言文」は古典中国語スタイルで回答させるという完全にネタのようなモードですが、実際にトークン削減効果は最大です。さすが漢字文化圏の情報密度。
便利コマンド
caveman-commit:簡潔なgitコミットメッセージを自動生成します。「fix bug」みたいな雑なやつじゃなく、ちゃんと意味のある短文を生成してくれます。
caveman-review:コードレビューを1行で返します。「PRにコメントが50行ついてて読む気がしない」という問題を解決します。
caveman-compress:入力プロンプトを自動圧縮し、Input tokenも約46%削減します。長い仕様書やコードをそのまま貼り付けても、コストを抑えられます。
cavemanのエコシステムには他にも関連ツールがあります。cavememはセッション記憶の管理ツールで、claude-memでセッション記憶を永続化した経験があるなら、その穴居人版と考えるとわかりやすいです。
また、コードベースの理解を深めるならgraphifyでナレッジグラフ化するアプローチとの組み合わせも有効です。caveman + graphifyで「素早く・深く・安く」コードを理解できます。
複数エージェントを連携させる高度な使い方には、agency-agentsとClaude Codeの連携も参考にしてください。マルチエージェント環境ではトークン消費が積み重なるため、cavemanの恩恵がさらに大きくなります。
まとめ
cavemanは「AIの回答を穴居人レベルに簡潔にする」というシンプルなコンセプトで、出力トークンを最大75%削減するOSSスキルです。
- コスト削減:約71%(Output tokenが激減)
- 速度向上:約3〜4倍(生成文字数が減るため)
- 技術的正確さ:100%維持(arxiv研究で実証)
- 対応エージェント:Claude Code、Cursor、Windsurf、Gemini CLIなど
インストールはワンライナー。使い方は /caveman と打つだけ。
Claude Codeのコストが気になっている方は、とりあえず入れてみる価値は十分あります。穴居人はローリスク・ハイリターンです。
よくある質問(FAQ)
Q. 穴居人モードにすると、回答の質が落ちませんか?
A. 落ちません。arxivの研究で技術的正確さ100%維持が確認されています。情報は同じで、ただ言葉が少なくなるだけです。「うわ、省きすぎてわからん」となった場合は/caveman liteに戻すか、通常モードで再質問してください。
Q. 日本語での回答にも対応していますか?
A. 対応しています。ただし、cavemanは英語でのトークン削減効果が最大化されるよう設計されています。日本語でも効果は出ますが、英語ベースのプロジェクトで使うとより恩恵が大きくなります。
Q. /caveman ultra と 文言文 はどちらが簡潔ですか?
A. 文言文(古典中国語)が最も簡潔です。漢字1文字に多くの意味が詰め込まれているため、情報密度が段違いです。ただし、読み慣れていないと解読に時間がかかる場合があります。ネタ枠としても優秀です。
Q. cavemanをオフにするにはどうすればいいですか?
A. 新しいセッションを開始するか、/caveman off(または設定によっては通常のシステムプロンプトをリセット)することで解除できます。エージェントによって操作が異なるため、公式リポジトリのREADMEをご確認ください。
Q. cavememやcavekitとの違いは何ですか?
A. cavemanは出力トークン削減が目的です。cavememはセッション間の記憶を管理するツール、cavekitは開発を補助するユーティリティ集です。3つを組み合わせることで「穴居人フルスタック環境」が整います。

コメント