• Skip to main content
  • Skip to primary sidebar

bloggggggggggggggg

// コードと趣味の境界線上

オープンソースLLMの現状 — Llama, Mistral, Gemmaを全部試す

「AIはビッグテックの独占物」ってイメージ、2023年まではそうだった。でも2024年、オープンソースLLMの進化がヤバい。MetaのLlama 3、Mistral、GoogleのGemma——無料で使えて、ローカルでも動いて、しかもかなり賢い。

僕はこの半年で主要なオープンソースLLMを片っ端から試した。RTX 3090(24GB VRAM)一枚でここまでできるのか、って感動と興奮の連続だった。

主要モデルの所感:

  • Llama 3(Meta) — 8B版と70B版。8Bでも結構賢くて、個人のGPUでもサクサク動く。70Bは流石にVRAM 24GBに収まらないから4bit量子化して使う。全体的にバランスが良くて、最初に試すならこれ。コミュニティも巨大。
  • Mistral(Mistral AI) — フランス発。7Bでこの賢さは異常。特に英語とフランス語とコード。Mixtral 8x7B(MoEアーキテクチャ)は8人中2人だけ動かす方式で速い。
  • Gemma(Google) — 2Bと7B。小さいけどGeminiの技術が詰まってる。2Bはラズパイでも動くレベルなのに、簡単な会話なら十分。
  • Qwen 2.5(Alibaba) — 中国発。72Bがオープンソース化されてて、多言語性能(日本語も)が高い。
  • Command R+(Cohere) — エンタープライズ向け。RAGとツール使用に強い。

オープンソースLLMのいいところ:

  • プライバシー — データが外部に出ない。機密情報を扱う業務に必須
  • カスタマイズ自由 — ファインチューニングもマージもやり放題
  • ランニングコストゼロ — 電気代だけ
  • 検閲がない — Uncensored版も作れる

でも正直、GPT-4oやClaude 3.5 Sonnetにはまだ及ばない。ただ、差は急速に縮まってる。あと1年で逆転する可能性もあり得る。

参考:Meta Llama | Mistral AI

← AIセーフティとアラインメントの問題 — 誰がAIの「正しさ」を決めるのか
AIが変える検索体験 — Perplexityの衝撃 →

Primary Sidebar

最近の投稿

  • インフラエンジニアのキャリアパス — 手動運用からSREへ
  • 障害対応の心得 — 本番で焦らないために
  • 監視設計の基本 — 何をどう見るべきか
  • ログ管理 — ELKスタック入門
  • HTTPSと証明書管理 — Let’s Encryptの恩恵を最大限に

アーカイブ

  • May 2026

カテゴリー

  • AI
  • Linux
  • OS
  • Windows
  • インフラ・DevOps
  • おうちサーバー
  • サーバー・インフラ
  • ツール・環境
  • プログラミング
  • 未分類
  • 開発哲学

最近のコメント

No comments to show.

© 横山鉄工所 & まめたろう重工