graphifyでコードベースをナレッジグラフ化する方法【AIコーディングツール対応】
「コードが複雑になりすぎて、AIに全部読ませたらトークンが爆発した…」という経験、ありませんか?
大きなリポジトリをClaude CodeやCursorに丸投げすると、あっという間にコンテキスト制限に引っかかりますよね。その問題をスマートに解決してくれるのが、今GitHubで急速にスターを集めているOSSツール「graphify」です。
2026年3月現在、23,000スター超えという驚異的な数字を叩き出しているgraphify。今月のGitHubトレンドでも取り上げられるほど注目されているこのツールを、今日は徹底解説します。
graphifyとは?AIコーディングツールで使えるナレッジグラフ化コマンド
graphifyは、Claude Code・Cursor・OpenAI CodexなどのAIコーディングアシスタントに追加できるカスタムスキル(スラッシュコマンド)です。
使い方はシンプルで、対応ツール上で /graphify コマンドを実行するだけ。するとコードベースや各種ドキュメントを自動で読み込み、ナレッジグラフとして構造化してくれます。
対応しているファイル形式
- コード: Python、JavaScript、Go、Rust、Java など22言語
- ドキュメント: PDF、Markdown、テキストファイル
- メディア: 画像(スクリーンショット含む)、動画
- 論文・スライド: 学術論文やプレゼン資料もOK
つまり「プロジェクトに関係するもの全部」を一括でグラフ化できるわけです。
なぜナレッジグラフなのか?
従来のAIコーディングでは、コードをそのまま(raw files)AIに渡していました。これだと巨大なリポジトリは即座にトークン上限に達してしまいます。
graphifyのアプローチは「構造を先に把握させる」こと。コードの依存関係・クラス・関数間の関係をグラフとして表現し、AIが必要な部分だけを効率的に参照できるようにします。
公式によれば、raw filesと比較して最大71.5倍のトークン削減を実現しているとのこと。これは副業エンジニアにとってもAPIコスト削減という意味で嬉しいポイントです。
graphifyの主な機能と技術的な仕組み
スター数だけでなく、技術的な中身もかなりしっかりしています。
tree-sitter ASTによる構文解析
graphifyの根幹は、Microsoftが開発したtree-sitterを使ったAST(抽象構文木)解析です。単純なテキストマッチングではなく、コードの構造そのものを理解してグラフのノードを生成します。
対応言語はPython・JavaScript・TypeScript・Go・Rust・Java・C/C++・Ruby・Kotlin など22言語。主要な言語はほぼカバーされています。
Leiden法によるコミュニティ検出
生成されたグラフに対して、Leiden法というクラスタリングアルゴリズムを適用し、関連するコードのまとまり(コミュニティ)を自動検出します。
注目すべきは「埋め込みベクトル不要」という点。OpenAI Embeddings APIなどを使わずに済むため、追加コストがかかりません。LLMなしで動作するので、BitNetでCPU推論のような軽量構成とも相性が良いです。
出力ファイル一覧
| ファイル | 内容 |
|---|---|
graph.html |
インタラクティブなビジュアルグラフ |
GRAPH_REPORT.md |
Markdown形式のサマリーレポート |
graph.json |
プログラムから扱えるJSON形式 |
cache/ |
再解析不要にするキャッシュ |
graph.html はブラウザで開くだけでコードベース全体の関係図をぐりぐり動かせます。チームへの共有や、自分のリポジトリの把握にも使えます。


コメント