FreeLLMAPI:14のAIプロバイダー無料枠を束ねて月13億トークン無料で使う方法

Uncategorized

`markdown

title: 月13億トークン無料ってマジ?FreeLLMAPIで14社のAI無料枠を全部使い倒す
slug: freellmapi-free-llm-api-proxy-14-providers
description: FreeLLMAPIはGemini・Groq・Mistralなど14社の無料枠を1つのOpenAI互換エンドポイントに束ねるプロキシ。個人開発のAPIコストをゼロにする方法を解説。

月13億トークン無料ってマジ?FreeLLMAPIで14社のAI無料枠を全部使い倒す

AIのAPIコスト、地味に痛くないですか?

個人開発でちょっとしたチャットボットを作る、副業プロジェクトにAIを組み込む、新しいモデルを試したい――そのたびにクレジットカードの残高が減っていく。GPT-4oを本番で使ったら月末に請求額を見て青ざめた、という経験がある人も多いはず。

実は各AIプロバイダーは、毎月かなり太っ腹な無料枠を提供している。GoogleのGemini APIは月100万トークン無料、GroqはLlama 3.3を分あたり数百リクエスト無料、SambaNovaはDeepSeek V3を無料で使える……。でも問題は14社それぞれにAPIキーを管理して、SDKを書き換えて、フェイルオーバーを実装してという作業が激しく面倒なこと。

それをまるごと解決するのが FreeLLMAPI だ。

FreeLLMAPIとは? 仕組みと対応プロバイダー

[FreeLLMAPI(GitHub: tashfeenahmed/freellmapi)](https://github.com/tashfeenahmed/freellmapi) は、14社のAIプロバイダーの無料枠を1つのOpenAI互換エンドポイントに集約するプロキシサーバーだ。2026年5月にGitHubで急上昇し、スター数6,322を超えた注目のOSSプロジェクト(MIT License / TypeScript製)。

どう動くのか

`
あなたのアプリ
↓ OpenAI互換リクエスト(base_url だけ変える)
FreeLLMAPIプロキシ(localhost:3000)
↓ 最適なプロバイダーにルーティング
Google / Groq / Mistral / SambaNova … (14社)
`

クライアント側はOpenAI SDKの base_url を変えるだけ。プロバイダーのAPIキーや切り替えロジックはプロキシ側が完全に隠蔽する。

主な機能

| 機能 | 内容 |
|——|——|
| 自動フェイルオーバー | 429/5xxエラー → 次プロバイダーに自動切り替え(最大20回リトライ) |
| レート追跡 | RPM/RPD/TPM/TPD をAPIキー単位で管理 |
| スティッキーセッション | 30分間同じモデルを継続利用(モデル切り替えによる文脈崩れを防止) |
| AES-256-GCM暗号化 | 各プロバイダーのAPIキーをSQLiteに暗号化保存 |
| 統合APIキー | クライアントは freellmapi-… の1トークンだけ管理すればOK |

対応プロバイダー(2026年5月時点)

  • Google ― Gemini 2.5 Flash 等
  • Groq ― Llama 3.3 / 4、Qwen3
  • Cerebras ― Qwen3 235B
  • SambaNova ― DeepSeek V3.x、Llama 4、Gemma 3
  • Mistral ― Large 3、Codestral、Devstral
  • OpenRouter ― 無料モデル21個
  • GitHub Models ― GPT-4.1、GPT-4o
  • Cloudflare ― Kimi K2、GLM-4.7 等
  • Cohere ― Command R+ 等
  • Z.ai/Zhipu ― GLM-4.5 等
  • NVIDIA NIM
  • HuggingFace ― DeepSeek V4、Kimi K2.6 等
  • 合計すると月約13億トークン(1.3B)が無料の範囲内で使える計算になる。個人開発で使い切るのはむしろ難しいレベルだ。

    セットアップ手順(15分で動く)

    1. リポジトリをクローンして依存関係をインストール

    `bash
    git clone https://github.com/tashfeenahmed/freellmapi
    cd freellmapi
    npm install
    `

    Node.js 18以上が必要。まだ入っていなければ nvm か公式インストーラーで準備しておこう。

    2. プロバイダーのAPIキーを取得する

    使いたいプロバイダーのAPIキーを事前に発行しておく。全部そろえる必要はなく、Google + Groq + Mistralの3つだけでも十分すぎるほど使える。それぞれのコンソールでアカウントを作ればすぐに無料のAPIキーが発行できる。

    3. セットアップコマンドを実行

    `bash
    npm run setup
    `

    対話式のプロンプトが起動し、各プロバイダーのAPIキーを順番に入力できる。入力したキーはAES-256-GCMで暗号化されてローカルのSQLiteに保存される。スキップしたいプロバイダーはそのままEnterでOK。

    4. サーバーを起動

    `bash
    npm start
    `

    http://localhost:3000 でプロキシが起動する。ログに FreeLLMAPI running on port 3000 と表示されれば成功だ。

    VPSで常時稼働させたい場合

    自宅開発機だけでなく、外出先や副業プロジェクトのチームでも使いたいなら、VPSへのデプロイが便利だ。筆者は ConoHa VPS の512MBプランで動かしているが、Node.jsプロセス1つが動けばいいので月数百円で十分。pm2systemd でデーモン化しておくと再起動後も自動で立ち上がる。

    `bash

    pm2でデーモン化する例

    npm install -g pm2
    pm2 start npm –name freellmapi — start
    pm2 save
    pm2 startup
    `

    使い方(base_urlを変えるだけ)

    既存のOpenAI SDKコードをほぼそのまま流用できる。

    Python(openai ライブラリ)

    `python
    from openai import OpenAI

    client = OpenAI(
    api_key=”freellmapi-xxxxxxxxxxxxxxxx”, # setupで発行されるトークン
    base_url=”http://localhost:3000/v1″
    )

    response = client.chat.completions.create(
    model=”gemini-2.5-flash”, # 使いたいモデルを指定
    messages=[{“role”: “user”, “content”: “Rustで簡単なWebサーバーを書いて”}]
    )
    print(response.choices[0].message.content)
    `

    TypeScript / Node.js

    `typescript
    import OpenAI from “openai”;

    const client = new OpenAI({
    apiKey: “freellmapi-xxxxxxxxxxxxxxxx”,
    baseURL: “http://localhost:3000/v1”,
    });

    const response = await client.chat.completions.create({
    model: “llama-3.3-70b-versatile”,
    messages: [{ role: “user”, content: “コードレビューしてください” }],
    });
    console.log(response.choices[0].message.content);
    `

    モデル名を変えるだけで別プロバイダーに切り替わる。429エラーになっても自動でフェイルオーバーするので、レート制限を意識せずに書けるのが最大のメリットだ。

    対応モデル一覧と用途別おすすめ

    用途に応じてモデルを使い分けるとトークン節約と品質を両立できる。

    コーディング・デバッグ

    | モデル名 | プロバイダー | 特徴 |
    |———-|————-|——|
    | devstral-small | Mistral | コード生成特化、軽量で高速 |
    | codestral-latest | Mistral | 多言語コード補完が得意 |
    | deepseek-v3 | SambaNova | 長いコードベース理解に強い |

    ターミナルからAIにコードを書かせるワークフローには [DeepSeek-Reasonixでターミナルからコーディング](https://devsideup.com/deepseek-reasonix-terminal-ai-coding-agent/) の記事も参考になる。

    高品質な文章生成・チャット

    | モデル名 | プロバイダー | 特徴 |
    |———-|————-|——|
    | gemini-2.5-flash | Google | 高速・高品質、多言語対応 |
    | command-r-plus | Cohere | RAGや長文処理が得意 |
    | llama-4-scout | SambaNova | Metaの最新軽量モデル |

    リサーチ・推論

    | モデル名 | プロバイダー | 特徴 |
    |———-|————-|——|
    | qwen3-235b | Cerebras | 超大型モデル、複雑な推論向き |
    | gpt-4o | GitHub Models | 汎用最高峰、調査タスク全般 |
    | kimi-k2 | Cloudflare | 長文コンテキスト処理が強み |

    AIを使って調査・リサーチを自動化したい場合は [Local Deep ResearchでAI調査を自動化](https://devsideup.com/local-deep-research-local-llm-ai-research/) も合わせて読むとローカルLLM活用の幅が広がる。

    じさくエンジニア向け活用アイデア

    個人開発

  • 趣味アプリのAI機能をゼロコスト化: チャットUI、画像キャプション生成、コード解説機能など、マネタイズ前の段階ではAPIコストをかけたくない。FreeLLMAPIなら開発〜β公開まで完全無料で回せる。
  • 複数モデルのA/Bテスト: フェイルオーバーの仕組みを使ってモデルごとのレスポンス品質を比較し、本番で使うモデルを選定できる。
  • 副業・受託開発

  • クライアントへのデモ環境構築: 「とりあえず動くもの」を見せる段階のコストを抑えられる。本番移行時にプロバイダーを切り替えれば良い。
  • プロトタイプの量産: 複数の副業案件を掛け持ちしているなら、プロトタイプフェーズのAPIコストが積み上がりがち。FreeLLMAPIで全案件分をまかなえる。
  • 学習・研究

  • プロンプトエンジニアリングの実験: 同じプロンプトを複数モデルに投げて比較するとき、モデルごとにSDKを書き換える手間がなくなる。
  • LLMアプリ開発の練習: LangChainやLlamaIndexのサンプルコードがそのまま使えるので、学習コストが低い。
  • 注意事項(必ず読んでほしい)

    FreeLLMAPIは非常に便利だが、使う前に以下を理解しておくこと。

    個人実験用途のみ

    READMEに明記されている通り “For personal experimentation only”。本番サービスや商用プロダクトへの組み込みは想定外の使い方だ。

    各プロバイダーのToS遵守

    FreeLLMAPIはあくまでプロキシであり、実際のリクエストは各プロバイダーのAPIを通じて送信される。GeminiならGoogleのToS、GroqならGroqのToSに従う必要がある。自動化ツールやスクレイピングへの組み込みが禁止されているプロバイダーもあるため、利用規約は各自で確認すること。

    無料枠にはレート制限がある

    「月13億トークン」はあくまで合算値であり、個々のプロバイダーには分単位・日単位のレート制限(RPM/RPD)がある。短時間に集中した大量リクエストには向いていない。

    APIキーの管理

    プロバイダーのAPIキーをローカルに保存する設計上、共有サーバーへのデプロイや他人へのアクセス共有には十分注意すること。VPSで動かす場合はファイアウォールでポートを制限し、必要なIPのみ許可するのが基本だ。

    まとめ

    FreeLLMAPIは「無料枠を1つにまとめる」というシンプルな発想で、個人開発・副業のAPIコスト問題をほぼ解決してしまうツールだ。OpenAI互換なので既存コードへの組み込みも最小限の変更で済み、自動フェイルオーバーのおかげでレート制限を意識する場面もほとんどない。

    個人実験用途という制限はあるが、マネタイズ前のプロトタイプ開発・学習・趣味プロジェクトには申し分ない。まずはローカルで試してみて、継続的に使うなら ConoHa VPS に移してみよう。

    よくある質問(Q&A)

    Q1. 商用サービスに組み込んでいいですか?

    A. いいえ。FreeLLMAPI自体のライセンスはMITですが、プロジェクトは個人実験用途を明示しています。商用利用の場合は各プロバイダーの有料プランを直接契約してください。

    Q2. セットアップ後に新しいプロバイダーを追加できますか?

    A. npm run setup を再実行すれば追加・変更が可能です。既存のキーは上書きか保持かを選べます。

    Q3. VPSで動かす場合、スペックはどれくらい必要ですか?

    A. FreeLLMAPIはプロキシとして動作するだけなので、CPUはほぼ消費しません。メモリ512MB・ストレージ10GBあれば十分です。ConoHa VPS の最小プランでも快適に動作します。
    `

    コメント

    タイトルとURLをコピーしました