OllamaでLLMをローカル実行する完全ガイド【2025年版】

「ChatGPTにコード貼るの、セキュリティ的にちょっと怖い……」って思ったことない？

業務コードや個人プロジェクトの機密情報をクラウドのAIに流すのは、確かにリスクがある。でも、手元にLLMを動かせたら話は変わる。APIキー代もかからない。インターネット接続も不要。ログも残らない。

それを一発で解決してくれるのが Ollama だ。

Ollamaを使えば、Llama3・Gemma・Mistralなどの最新LLMを自分のマシンにインストールして、CLIやAPIで自由に使える。しかもDockerいらず、難しい設定もなし。ollama run llama3 の1行で対話が始まる。

この記事では、インストール方法から実際のAPI活用、VPS上でのサーバー運用まで、実際に動かした手順を丸ごと共有する。

Ollamaとは？OSSのローカルLLMランタイム

Ollama（オラマ）は、LLMをローカルで実行するためのOSSツール。GitHubスター数は現在10万超。2023年末から急激に伸びて、今もアクティブに開発が続いている。

特徴をまとめると：

Ollama公式のモデルライブラリにアクセスすると、利用可能なモデルが一覧で見られる。代表的なものを整理した。

RAM 8GBのマシンなら7B前後のモデルが快適に動く。16GB以上あれば13B〜27Bクラスも試せる。

macOSとLinuxは公式スクリプト1行でインストール完了。