MedAE

機械学習の評価指標：MedAE入門

真ん中絶対誤差（略して、ま誤差）は、機械学習のモデルがどれくらい正確に数値を予想できるかを測る物差しです。言い換えると、予想した値と本当の値がどれくらい離れているかを測るものです。特に、数値を予想する問題でよく使われます。ま誤差は、「誤差の絶対値の中央値」として計算されます。まず、モデルに色々な値を予想させます。そして、それぞれの予想値と本当の値の差を調べます。この差を「誤差」と言います。誤差にはプラスとマイナスがありますが、ま誤差では、誤差のプラスマイナスを無視するために、誤差の絶対値を使います。例えば、誤差が「３」と「－５」だった場合、絶対値はどちらも「３」と「５」になります。次に、これらの絶対値を小さい順に並べ替えます。そして、ちょうど真ん中に来る値を見つけます。これがま誤差です。ま誤差の大きな特徴は、極端に大きい値や小さい値に影響されにくいことです。このような極端な値を外れ値と呼びます。例えば、ほとんどの家の値段が３千万円から５千万円の範囲にある地域で、１００億円の城が売られていたとします。もし家の値段を予想するモデルを作った場合、この１００億円の城は外れ値になります。普通の誤差（平均絶対誤差）を使うと、この外れ値に大きく影響されてしまいます。しかし、ま誤差は真ん中の値を使うので、このような外れ値に影響されにくく、より信頼できる結果を得ることができます。つまり、ま誤差は、外れ値を含むかもしれないデータに対して特に役立つ評価方法と言えるでしょう。たくさんのデータの中にいくつかおかしな値が混ざっていても、ま誤差を使えば、モデルの本当の性能を正しく評価することができます。

2024.11.26

機械学習