LLMのハルシネーションとどう付き合うか — 「嘘」を前提に使う発想

「AIが自信満々に嘘をつく」——ハルシネーション（幻覚）はLLM最大の弱点であり、最大の特徴でもある。GPT-4だろうがClaude 3.5だろうが、確率的に100%防ぐことは原理的に不可能だ。

最初の頃、僕はハルシネーションを「バグ」だと思ってイライラしてた。でも仕組みを理解するうちに、これはバグじゃなくてLLMの本質的な特徴だって気づいた。LLMは「事実を答える機械」じゃなくて「もっともらしい文章を生成する機械」だから。

ハルシネーションが起きる主な理由：

確率分布の外れ値 — 訓練データにない質問に対して、無理やり確率の高い単語をつなげて「それっぽい」回答を作る
学習データのノイズ — インターネットには間違った情報が溢れてる。それを真に受けて学習してるケース
RLHFの副作用 — 「丁寧に答える」ことを重視しすぎて、「わかりません」より「多分こうです」を選ぶ傾向
自己回帰の雪だるま — 最初の一言を間違えると、その後の文章が全部その間違いの上に積み上がる

僕が実践してるハルシネーション対策：

検証可能な質問に限定する — 「〜の文献を教えて」には答えるけど、「正しいか確認して」とは言わない。事実確認は自分でやる。
情報源を明示させる — 「出典も一緒に教えて」と頼む。間違ってたら辿れる。
RAGを併用する — 事前に用意した信頼できる文書だけを参照させる。これが一番確実。
複数回聞いてクロスチェック — 同じ質問を言い回しを変えて複数回聞く。一貫性がない回答は疑う。

結局、LLMは「優秀だけど嘘つきの後輩」くらいの距離感がちょうどいい。全部信じるのは危険、全部疑うのはもったいない。

参考：A Survey of Hallucination in LLMs