Fβスコア:機械学習の評価指標
機械学習では、作った模型の働きぶりをきちんと測ることは、模型選びや改良に欠かせません。模型の良し悪しを測る物差しは色々ありますが、その中でエフベータ値は、的中率と網羅率を合わせた物差しです。的中率とは、選んだものの中で本当に正解だったものの割合で、網羅率とは、正解の全体の中でどれだけの正解を選び出せたかの割合です。エフベータ値を使う良い点は、正解と間違いの数の差が大きいデータでも、偏りなく性能を評価できることです。
エフベータ値は、0から1までの値で表されます。1に近いほど模型の性能が良いことを示し、完全に正解の場合には1になります。この物差しは、情報探しや言葉を扱う処理など、色々な分野で広く使われています。特に、間違いの種類によって、どちらか一方を重視したい場合に、ベータの値を変えることで、うまく対応できるので、とても便利な物差しです。例えば、病気の診断で、実際は病気なのに健康と判断する間違い(偽陰性)は、病気でないのに病気と判断する間違い(偽陽性)よりも重大な結果を招く可能性があります。このような場合、偽陰性を減らすことに重点を置くために、ベータの値を1より大きく設定します。逆に、スパムメールの検出では、普通のメールをスパムと間違えること(偽陽性)が、スパムメールを見逃すこと(偽陰性)よりも問題になることが多いので、ベータの値を1より小さく設定します。このように、目的に合わせてベータ値を調整することで、より適切な評価を行うことができます。このため、エフベータ値は、様々な状況に対応できる、柔軟性の高い性能評価の物差しと言えるでしょう。