最適なモデル選び:情報量規準入門
機械学習では、与えられた情報から様々な計算の仕組みを作ることができます。しかし、どの仕組みが一番いいのかを決めるのはとても難しい問題です。単純に計算の正確さだけで判断すると、思わぬ落とし穴にはまることがあります。複雑な仕組みほど、学習に使った情報にはぴったり合うように作られます。しかし、複雑すぎる仕組みは、新しい情報に対する予測の正確さが落ちてしまうことがあるのです。これは、いわば「詰め込み学習」のようなもので、既に知っている問題への答えは完璧に覚えているけれども、少し違う問題が出されると対応できない状態に似ています。
本当に良い仕組みとは、学習に使った情報だけでなく、まだ見ていない新しい情報に対しても高い予測能力を持つものです。そのためには、仕組みの複雑さと予測能力のバランスを考える必要があります。複雑すぎると、学習に使った情報に過剰に適応してしまい、新しい情報への対応力が低下します。逆に、単純すぎると、学習に使った情報の特徴を十分に捉えきれず、予測能力が不足します。
このバランスをうまくとるために、「情報量規準」と呼ばれる尺度が用いられます。情報量規準は、仕組みの複雑さと予測能力の両方を考慮して、仕組みの良さを数値で表すものです。具体的には、AICやBICといった情報量規準がよく使われます。これらの規準を用いることで、様々な仕組みの中から、最もバランスの取れた、良い仕組みを選ぶことができます。情報量規準は、新しい情報への対応能力も考慮に入れているため、過剰に複雑な仕組みを選んでしまうことを防ぎ、より実用的な仕組みの選択に役立ちます。