偽陽性と偽陰性:2つの過誤
機械学習を用いて物事を判別する際に、結果の良し悪しを正しく評価することはとても大切です。この評価を適切に行う上で、「偽陽性」と「偽陰性」という二つの考え方は欠かせません。これらは、実際に起きたことと機械が予測したことの食い違いを表すもので、機械学習のモデルの正確さを測る重要な指標となります。
まず、「陽性」と「陰性」について説明します。「陽性」はある出来事が起きると予測することで、「陰性」はその反対に、出来事は起きないと予測することです。例えば、健康診断で病気を検査する場合、「陽性」は病気に罹患していると予測することで、「陰性」は病気に罹患していないと予測することです。
次に、「偽陽性」とは、実際には出来事が起きていないにも関わらず、起きると予測してしまう誤りのことです。健康診断の例で言えば、実際には健康なのに、病気だと誤って診断してしまう場合が「偽陽性」です。偽陽性の結果を受け取ると、必要のない検査や治療を受けてしまったり、精神的な負担を感じてしまったりする可能性があります。
一方、「偽陰性」とは、実際には出来事が起きているにも関わらず、起きないと予測してしまう誤りのことです。健康診断の例で言えば、実際には病気なのに、健康だと誤って診断してしまう場合が「偽陰性」です。偽陰性は、適切な治療の開始を遅らせてしまい、病状を悪化させてしまう危険性があります。
このように、偽陽性と偽陰性はどちらも望ましくない誤りですが、どちらの誤りがより深刻な影響を与えるかは、状況によって異なります。例えば、命に関わる病気の診断では、偽陰性の方が偽陽性よりも深刻な結果をもたらす可能性が高いでしょう。そのため、機械学習モデルを構築する際には、これらの誤りの発生率を慎重に評価し、目的に合わせて適切な調整を行う必要があります。