• Skip to main content
  • Skip to primary sidebar

bloggggggggggggggg

// コードと趣味の境界線上

Ollama入門 — 1コマンドでLlama 3を動かす衝撃

「ローカルLLMを動かす」って聞くと、CUDAのインストール、Pythonの仮想環境、モデルの変換…と面倒なイメージがある。でもOllamaを知った瞬間、そのイメージは粉々になった。

$ ollama run llama3

これだけでLlama 3 8Bが動く。pip installもgit cloneも不要。macOSでもLinuxでもWindowsでも同じコマンド。このシンプルさが革命的だった。

Ollamaのインストールは公式サイトからワンクリック。中身はllama.cppを内部で使っていて、モデルのダウンロード、量子化、推論まで全部自動でやってくれる。

よく使うコマンド:

# モデルをダウンロードして実行
ollama run llama3

# 利用可能なモデル一覧
ollama list

# モデルの削除
ollama rm llama3

# APIサーバーとして起動(OpenAI互換!)
ollama serve

# Modelfileでカスタムモデル作成
ollama create mymodel -f Modelfile

一番驚いたのはOpenAI API互換エンドポイントがあること。`ollama serve` して `http://localhost:11434/v1/chat/completions` にリクエストを投げるだけで、OpenAIのライブラリがそのまま使える。コードを一行も変えずに、GPT-4からLlama 3に切り替えられる。

対応モデルも充実してる。Llama 3、Mistral、Gemma、Phi-3、Qwen、Command R、その他コミュニティモデル数百種類。HuggingFaceのGGUFファイルをインポートすれば何でも動く。

「とりあえずローカルLLM触ってみたい」って人には、Ollama以外の選択肢は考えられない。

参考:Ollama公式

← なぜローカルLLMなのか — プライバシーと自由の話
llama.cppの魔法 — CPUだけでLLMを動かす技術 →

Primary Sidebar

最近の投稿

  • インフラエンジニアのキャリアパス — 手動運用からSREへ
  • 障害対応の心得 — 本番で焦らないために
  • 監視設計の基本 — 何をどう見るべきか
  • ログ管理 — ELKスタック入門
  • HTTPSと証明書管理 — Let’s Encryptの恩恵を最大限に

アーカイブ

  • May 2026

カテゴリー

  • AI
  • Linux
  • OS
  • Windows
  • インフラ・DevOps
  • おうちサーバー
  • サーバー・インフラ
  • ツール・環境
  • プログラミング
  • 未分類
  • 開発哲学

最近のコメント

No comments to show.

© 横山鉄工所 & まめたろう重工