ハルシネーションとは？生成AIが嘘をつく原因と5つの対策をわかりやすく解説

言語モデル

2026.03.13

ハルシネーションとは

ハルシネーション（Hallucination）とは、生成AIが事実に基づかない情報をもっともらしく生成してしまう現象です。日本語では「幻覚」と訳され、AIが「嘘をつく」「でたらめを言う」と表現されることもあります。

ChatGPTやClaudeなどの大規模言語モデル（LLM）は、膨大なテキストデータから学習した統計的パターンに基づいて文章を生成します。そのため、実際には存在しない人名、論文、URLなどを「自信満々に」出力してしまうことがあります。

種類	具体例	危険度
事実の捏造	存在しない研究論文や統計データを引用する	高
人物情報の誤り	実在の人物に架空の経歴や発言を付与する	高
日付・数値の誤り	歴史的事件の年号や統計の数値を間違える	中
URLの生成	存在しないWebページのURLをもっともらしく生成	中
論理の飛躍	前提と結論が論理的に繋がっていない推論	中
文脈の取り違え	同名の異なる概念を混同して説明する	低〜中

LLMの本質は「前の文脈に基づいて、次に来る確率が最も高い単語を予測する」こと。つまり、LLMは「真実かどうか」ではなく「もっともらしいかどうか」で文章を生成しています。

例えば「ノーベル物理学賞を受賞した日本人は」という文に続けて、学習データの統計的パターンから「もっともらしい」人名を出力しますが、それが正しい保証はありません。

LLMの出力にはランダム性（temperature）が含まれます。temperatureが高いほど多様な出力が生まれますが、同時にハルシネーションのリスクも高まります。

米国で弁護士がChatGPTに法律調査を依頼し、AIが生成した架空の判例を裁判所に提出。実在しない判例だったことが発覚し、弁護士が制裁を受けました。

AIが不正確な医療情報を生成し、それを信じた患者が誤った自己判断をするリスクが指摘されています。

AIが生成した架空の情報源や引用が記事に紛れ込み、誤報に繋がるケースが報告されています。

最も効果的な対策の一つ。回答生成時に外部データベースから関連情報を検索し、それを根拠として回答を生成します。出典を明示できるため、ファクトチェックも容易になります。

AIの回答を特定の信頼できる情報源に紐づける手法。Google検索結果やWikipediaなどの外部ソースと照合し、事実確認を行います。

生成の確率的ランダム性を制御するパラメータ。事実に基づく回答が必要な場合はtemperatureを低く（0〜0.3）設定することで、ハルシネーションのリスクを低減できます。

特定ドメインの高品質なデータでモデルを追加学習させることで、そのドメインでのハルシネーションを減らします。

人間のフィードバックによる強化学習（RLHF）や、AIの行動規範を設定するConstitutional AIにより、「知らないことは知らないと言う」振る舞いを学習させます。

現時点では、ハルシネーションを完全にゼロにすることは技術的に困難です。LLMが確率的に文章を生成する仕組みである以上、100%正確な回答を保証することはできません。

しかし、RAGやグラウンディングなどの技術により、ハルシネーションの発生率は大幅に改善されています。また、AIの出力を人間が確認する「Human-in-the-Loop」のアプローチが、実用的な対策として広く採用されています。

ハルシネーションは、生成AIが確率的に文章を生成する仕組みに起因する構造的な課題です。完全な排除は困難ですが、RAG、グラウンディング、temperature調整などの技術的対策と、ユーザー側の検証習慣を組み合わせることで、リスクを大幅に低減できます。

生成AIを安全に活用するためには、「AIは便利だが間違えることもある」という前提に立ち、重要な情報は必ず人間が確認するという姿勢が不可欠です。