• Skip to main content
  • Skip to primary sidebar

bloggggggggggggggg

// コードと趣味の境界線上

GPTの仕組みをざっくり理解する — TransformerからRLHFまで

ChatGPTが出てきたとき、「どうやってこんな自然な会話ができるんだ?」って興味が湧いて、仕組みを調べまくった。結論から言うと、めちゃくちゃシンプルな原理の上に、膨大な計算とデータを積み重ねてるだけだった。

GPTのコアはTransformerという2017年にGoogleが発表したアーキテクチャ。これが従来のRNNやLSTMと決定的に違うのは「Attention(注意機構)」。文章全体を一度に見渡して、「どの単語がどの単語と関連してるか」を重み付けできる。これのおかげで長文でも文脈を見失わない。

学習は大きく3段階:

  1. 事前学習(Pre-training) — インターネット上の膨大なテキストを食わせて「次に来る単語を予測する」ゲームを延々と繰り返す。この段階で文法も知識も世界の常識も全部吸収する。GPT-3で約45TBのテキスト。想像を絶する量だ。
  2. 教師ありファインチューニング(SFT) — 人間が「良い応答」の例をたくさん作って、それに近づけるように学習。ここで「丁寧に答える」「質問にちゃんと答える」といった振る舞いを覚える。
  3. RLHF(人間のフィードバックからの強化学習) — これがChatGPTを「使える」ものにしたキモ。モデルの回答を人間がランク付けして、その好みを学習させる。「有害なことは言わない」「わからないときは素直にわからないと言う」みたいな振る舞いがここで刷り込まれる。

つまりGPTは「超巨大な確率計算機」。次に来る単語の確率を計算して、それを一個ずつ出力してるだけ。なのに、そこから知性らしきものが立ち現れる。この「創発(emergence)」って現象、何度考えても鳥肌が立つ。

参考:Attention Is All You Need | OpenAI InstructGPT

← AIコーディングアシスタントの実力比較 — Copilot, Cursor, Codeium
Claude vs GPT-4 — 使ってみて感じる本質的な違い →

Primary Sidebar

最近の投稿

  • インフラエンジニアのキャリアパス — 手動運用からSREへ
  • 障害対応の心得 — 本番で焦らないために
  • 監視設計の基本 — 何をどう見るべきか
  • ログ管理 — ELKスタック入門
  • HTTPSと証明書管理 — Let’s Encryptの恩恵を最大限に

アーカイブ

  • May 2026

カテゴリー

  • AI
  • Linux
  • OS
  • Windows
  • インフラ・DevOps
  • おうちサーバー
  • サーバー・インフラ
  • ツール・環境
  • プログラミング
  • 未分類
  • 開発哲学

最近のコメント

No comments to show.

© 横山鉄工所 & まめたろう重工