ハルシネーションとは
ハルシネーション(Hallucination)とは、生成AIが事実に基づかない情報をもっともらしく生成してしまう現象です。日本語では「幻覚」と訳され、AIが「嘘をつく」「でたらめを言う」と表現されることもあります。
ChatGPTやClaudeなどの大規模言語モデル(LLM)は、膨大なテキストデータから学習した統計的パターンに基づいて文章を生成します。そのため、実際には存在しない人名、論文、URLなどを「自信満々に」出力してしまうことがあります。
ハルシネーションの種類
| 種類 | 具体例 | 危険度 |
|---|---|---|
| 事実の捏造 | 存在しない研究論文や統計データを引用する | 高 |
| 人物情報の誤り | 実在の人物に架空の経歴や発言を付与する | 高 |
| 日付・数値の誤り | 歴史的事件の年号や統計の数値を間違える | 中 |
| URLの生成 | 存在しないWebページのURLをもっともらしく生成 | 中 |
| 論理の飛躍 | 前提と結論が論理的に繋がっていない推論 | 中 |
| 文脈の取り違え | 同名の異なる概念を混同して説明する | 低〜中 |
なぜAIはハルシネーションを起こすのか
1. 「次の単語を予測する」仕組みの限界
LLMの本質は「前の文脈に基づいて、次に来る確率が最も高い単語を予測する」こと。つまり、LLMは「真実かどうか」ではなく「もっともらしいかどうか」で文章を生成しています。
例えば「ノーベル物理学賞を受賞した日本人は」という文に続けて、学習データの統計的パターンから「もっともらしい」人名を出力しますが、それが正しい保証はありません。
2. 学習データの問題
- 学習データ自体の誤り:インターネット上の不正確な情報も学習している
- 知識のカットオフ:学習時点以降の出来事は知らないが、「知らない」と言えずに推測で回答する
- データの偏り:英語データが多く、日本語の専門的な情報が不足している場合がある
3. 確率的な生成プロセス
LLMの出力にはランダム性(temperature)が含まれます。temperatureが高いほど多様な出力が生まれますが、同時にハルシネーションのリスクも高まります。
ハルシネーションの実害
法律分野の事例
米国で弁護士がChatGPTに法律調査を依頼し、AIが生成した架空の判例を裁判所に提出。実在しない判例だったことが発覚し、弁護士が制裁を受けました。
医療分野のリスク
AIが不正確な医療情報を生成し、それを信じた患者が誤った自己判断をするリスクが指摘されています。
報道・ジャーナリズム
AIが生成した架空の情報源や引用が記事に紛れ込み、誤報に繋がるケースが報告されています。
ハルシネーションを減らす技術的対策
1. RAG(検索拡張生成)
最も効果的な対策の一つ。回答生成時に外部データベースから関連情報を検索し、それを根拠として回答を生成します。出典を明示できるため、ファクトチェックも容易になります。
2. グラウンディング
AIの回答を特定の信頼できる情報源に紐づける手法。Google検索結果やWikipediaなどの外部ソースと照合し、事実確認を行います。
3. temperature設定の調整
生成の確率的ランダム性を制御するパラメータ。事実に基づく回答が必要な場合はtemperatureを低く(0〜0.3)設定することで、ハルシネーションのリスクを低減できます。
4. ファインチューニング
特定ドメインの高品質なデータでモデルを追加学習させることで、そのドメインでのハルシネーションを減らします。
5. Constitutional AI / RLHF
人間のフィードバックによる強化学習(RLHF)や、AIの行動規範を設定するConstitutional AIにより、「知らないことは知らないと言う」振る舞いを学習させます。
ユーザー側でできる5つの対策
- 重要な情報は必ず原典で確認する:AIの回答を鵜呑みにせず、公式サイトや一次資料で裏付けを取る
- 「出典を示してください」と指示する:プロンプトで出典の提示を求めることで、検証可能性が高まる
- 具体的に質問する:曖昧な質問ほどハルシネーションが起きやすい。条件や範囲を明確にする
- 複数のAIで検証する:ChatGPT、Claude、Geminiなど異なるモデルの回答を比較する
- 「わからない場合はわからないと言ってください」と指示する:AIが推測で回答することを防ぐ
ハルシネーションは完全になくせるのか
現時点では、ハルシネーションを完全にゼロにすることは技術的に困難です。LLMが確率的に文章を生成する仕組みである以上、100%正確な回答を保証することはできません。
しかし、RAGやグラウンディングなどの技術により、ハルシネーションの発生率は大幅に改善されています。また、AIの出力を人間が確認する「Human-in-the-Loop」のアプローチが、実用的な対策として広く採用されています。
まとめ
ハルシネーションは、生成AIが確率的に文章を生成する仕組みに起因する構造的な課題です。完全な排除は困難ですが、RAG、グラウンディング、temperature調整などの技術的対策と、ユーザー側の検証習慣を組み合わせることで、リスクを大幅に低減できます。
生成AIを安全に活用するためには、「AIは便利だが間違えることもある」という前提に立ち、重要な情報は必ず人間が確認するという姿勢が不可欠です。
