偽陽性と偽陰性:機械学習の評価指標
機械学習という、まるで人が学ぶように計算機に学習させる技術において、予測の良し悪しを評価するために、混同行列と呼ばれる表がよく用いられます。この表は、結果が二択となる問題、例えば、病気か健康か、合格か不合格かといった問題を解く際に、特に役立ちます。
混同行列は、縦軸と横軸がそれぞれ実際の結果と予測結果を表す二行二列の表です。この表を用いることで、「真陽性」「偽陽性」「偽陰性」「真陰性」という四つの要素を明らかにし、予測の正確さを詳しく調べることができます。
例えば、ある病気を診断する検査を考えてみましょう。実際に病気の人を検査した結果、病気だと正しく判断された場合は「真陽性」と呼びます。これは、まさに検査がその役割を正しく果たしたと言えるでしょう。一方、実際には健康な人を検査したにも関わらず、病気だと誤って判断された場合は「偽陽性」と呼びます。これは、健康な人が不必要な心配をすることになりかねないため、注意が必要です。
反対に、実際に病気の人が健康だと誤って判断された場合は「偽陰性」です。これは、病気の発見が遅れ、適切な治療の開始が遅れる可能性があるため、非常に危険です。最後に、健康な人を健康だと正しく判断した場合は「真陰性」です。
このように、混同行列は、四つの要素を通じて、予測モデルの長所と短所を明らかにすることから、機械学習の分野では欠かせない道具となっています。それぞれの要素の値を見ることで、モデルがどれほど正確に予測できているかを理解し、さらなる改善に役立てることができるのです。