PR曲線下面積:精度と再現率の調和
機械学習のモデルを評価するには、様々な尺度を組み合わせて考えることが大切です。一つの尺度だけで判断しようとすると、モデルの真の実力を捉えきれないことがあります。よく使われる尺度に『精度』と『再現率』があります。『精度』は、正解と予測したデータのうち、実際に正解だったデータの割合です。例えば、10個のデータの中で3個を正解と予測し、そのうち2個が実際に正解だった場合、精度は2/3となります。一方、『再現率』は、実際に正解であるデータのうち、どれだけの割合を正解と予測できたかを表します。同じ例で、実際に正解のデータが5個あったとすると、再現率は2/5となります。
一見するとどちらも高ければ高いほど良いように思えますが、実際にはこの二つの尺度はトレードオフの関係にあることがよくあります。つまり、精度を高くしようとすると再現率が低くなり、逆に再現率を高くしようとすると精度が低くなるというジレンマが生じます。例えば、病気の診断を想像してみましょう。あらゆる可能性を考慮して、少しでも疑わしい人は全員病気と診断すれば(再現率重視)、病気の人を見逃す可能性は低くなります。しかし、健康な人も病気と診断されてしまう(精度低下)可能性が高くなります。反対に、検査結果が非常に明確な人だけを病気と診断すれば(精度重視)、健康な人を誤って病気と診断する可能性は低くなりますが、病気の人を見逃してしまう(再現率低下)可能性が高くなります。このように、精度と再現率はどちらか一方を優先するのではなく、バランスをとることが重要です。そして、このバランスを総合的に評価する指標の一つとして、PR-AUCと呼ばれるものがあります。PR-AUCは、様々な精度と再現率の組み合わせをグラフ化したときの面積で、値が大きいほどバランスが良いモデルと言えます。