未知データへの対応:汎化性能
学習をさせた機械には、初めて見る情報にもうまく対応できる能力が求められます。この能力のことを汎化性能と呼びます。汎化性能とは、学習に使っていないデータに対して、機械がどれくらい正確に予測や分類ができるかを示す指標です。
たとえば、たくさんの猫の絵を使って機械に猫を覚えさせた後、初めて見る猫の絵を見せたときに、機械がそれをきちんと猫だと判断できるかどうかが重要になります。学習に使った猫の絵だけを完璧に覚えたとしても、それだけでは現実世界で役に立つ機械とは言えません。なぜなら、現実世界には学習に使ったものとは少し違う猫の絵もたくさん存在するからです。機械が、学習したことをもとに、初めて見る猫の絵にも対応できる、これが汎化性能の高さにつながります。
汎化性能の低い機械は、学習に使ったデータに過剰に適応してしまい、それ以外のデータには対応できなくなってしまいます。これは、まるで特定の猫の絵だけを暗記してしまい、他の猫の絵を猫だと認識できないようなものです。このような状態を過学習と呼びます。過学習が起きると、見たことのないデータに対しては、まるで役に立たない機械になってしまいます。
反対に、汎化性能の高い機械は、学習したデータから本質的な特徴を捉え、それを新しいデータにも応用することができます。たとえば、猫の耳の形や目の形、ひげの本数といった特徴を学習することで、様々な種類の猫を猫だと正しく判断できるようになります。
機械学習では、この汎化性能を高めることが非常に重要です。そのため、学習データの選び方や学習方法を工夫し、未知のデータにも対応できる、本当に役立つ機械を作ることが目指されています。