コンテキストウィンドウとは?LLMの入力制限と長文処理の仕組みを解説

コンテキストウィンドウ:LLMの「記憶力」の仕組み

AI初心者

AIを知りたい

先生、ChatGPTに長い文章を貼り付けたら「長すぎます」ってエラーが出ました。AIにも入力制限があるんですか?

AIエンジニア

AIエンジニア

あるよ。それが「コンテキストウィンドウ」と呼ばれるものだ。LLM(大規模言語モデル)が一度の会話で処理できるテキスト量の上限のことで、「トークン」という単位で測定されるんだ。

AI初心者

AIを知りたい

トークンって文字数とは違うんですか?

AIエンジニア

AIエンジニア

違うよ。英語では1トークンが約4文字、日本語では1文字が約1〜2トークンに変換されることが多いんだ。つまり日本語はトークン消費が多いので、同じコンテキストウィンドウでも英語より入力できるテキスト量が少なくなるんだよ。

AI初心者

AIを知りたい

なるほど、日本語だと不利なんですね。モデルによってウィンドウサイズは違うんですか?

AIエンジニア

AIエンジニア

大きく違うよ。2026年現在、Gemini 2.5 Proが100万トークン、Claude 3.5が200Kトークン、GPT-4oが128Kトークンといった具合に、モデルごとにかなり差があるんだ。コンテキストウィンドウの大きさは、AIの実用性を左右する重要なスペックの1つだよ。

コンテキストウィンドウとは。

コンテキストウィンドウ(Context Window)は、大規模言語モデル(LLM)が1回のリクエストで処理できるテキストの最大量を示す指標です。入力テキスト(プロンプト)と出力テキスト(応答)の合計トークン数がこの上限を超えると、モデルは処理できなくなります。Transformerアーキテクチャの自己注意機構(Self-Attention)に起因する制約で、計算量がトークン数の二乗に比例して増加するため、物理的な限界があります。初期のGPT-3では4,096トークンでしたが、2024年のGemini 1.5 Proで100万トークンを達成し、2026年にはGemini 2.5 Ultraが200万トークンに対応するなど急速に拡大しています。長いコンテキストウィンドウにより、書籍全体の要約、大規模コードベースの分析、長時間の会議議事録処理などが可能になりました。

主要LLMのコンテキストウィンドウ比較

2026年現在、コンテキストウィンドウの長さは各モデルの重要な差別化要因になっています。用途に応じたモデル選択が重要です。

モデル コンテキスト長 日本語換算(概算) 書籍換算 API料金への影響
Gemini 2.5 Ultra 200万トークン 約100万文字 約20冊 トークン従量制
Gemini 2.5 Pro 100万トークン 約50万文字 約10冊 トークン従量制
Claude 3.5 Sonnet 200Kトークン 約10万文字 約2冊 トークン従量制
GPT-4o 128Kトークン 約6万文字 約1.5冊 トークン従量制
Llama 3.1 405B 128Kトークン 約6万文字 約1.5冊 セルフホスト可
GPT-3.5 Turbo 16Kトークン 約8,000文字 約0.2冊 低コスト

AI初心者

AIを知りたい

Geminiは200万トークンも処理できるんですか!でも長いほどコストも高くなるんですよね?

AIエンジニア

AIエンジニア

その通り。API利用では入力トークン数に応じて課金されるため、コンテキストが長いほどコストが上がるんだ。例えばGPT-4oで100Kトークン入力すると約25円かかる。だから、本当に必要な情報だけを入力する工夫が大切なんだよ。

長文処理のテクニックとRAGとの使い分け

コンテキストウィンドウに収まらない大量のデータを扱う場合、いくつかのアプローチがあります。RAG(検索拡張生成)とロングコンテキストは補完関係にあり、状況に応じた使い分けが重要です。

アプローチ 仕組み メリット デメリット 適した場面
ロングコンテキスト 大きなウィンドウに全テキストを入力 文脈の完全な理解 高コスト・速度低下 文書全体の要約・分析
RAG 関連部分だけ検索して入力 低コスト・最新情報対応 検索精度に依存 大量文書からのQA
チャンク分割 文書を分割して順次処理 任意の長さに対応 文脈が途切れる 大量テキストの処理
Map-Reduce 分割要約→統合要約 超長文に対応 情報が失われる可能性 複数文書の要約

AI初心者

AIを知りたい

RAGとロングコンテキストはどう使い分ければいいんですか?

AIエンジニア

AIエンジニア

シンプルに考えるなら、扱うデータが数十ページ程度ならロングコンテキスト、数百〜数万ページならRAGがおすすめだよ。例えば1冊の契約書を分析するならロングコンテキストが適切だけど、過去10年分の社内文書から情報を探すならRAGの方が効率的なんだ。2026年はコンテキストウィンドウがさらに拡大しているから、以前はRAGが必要だった用途もロングコンテキストで済むケースが増えているよ。

コンテキストウィンドウの進化と未来

コンテキストウィンドウは年々拡大しており、その技術的限界は急速に押し広げられています。

AI初心者

AIを知りたい

今後もっとコンテキストウィンドウは大きくなるんですか?

AIエンジニア

AIエンジニア

確実に大きくなっているよ。Ring Attention、Infini-Attention、State Space Modelといった新しいアーキテクチャが研究されていて、理論上は無限に近いコンテキスト長を実現する可能性もあるんだ。将来的には「コンテキストウィンドウ」という制約自体がなくなるかもしれないと言われているよ。AIの進化のスピードには本当に驚かされるね。

AI初心者

AIを知りたい

制限がなくなったら、本何冊分でもAIに読ませられるようになるんですね。楽しみです!