予測精度を測る指標:相対絶対誤差
統計や機械学習の世界では、予測モデルの良し悪しを測る物差しが必要です。作った予測モデルがどれくらい正確に未来を当てられるのか、これはとても大切なことです。その物差しの1つに、相対絶対誤差というものがあります。相対絶対誤差は、よくRSEと略されて呼ばれます。
機械学習のモデルは、与えられた情報をもとに、これからどうなるかを予測します。例えば、明日の気温や商品の売れ行きなどです。しかし、どんなに優れたモデルでも、予測が完全に当たることはまずありません。必ず、本当の値との間にずれが生じます。このずれの大きさを測る尺度こそが、RSEなのです。
RSEは、予測のずれを相対的な値で表します。相対的というのは、本当の値を基準にしてずれの大きさを考えるということです。例えば、1000円の商品の売上げを800円と予測した場合と、100円の商品の売上げを80円と予測した場合では、どちらも200円のずれですが、100円の商品の方がずれの割合が大きいと言えます。RSEはこのような割合を考慮に入れて計算されます。
具体的な計算方法は、まず予測値と本当の値の差を計算し、その絶対値を求めます。絶対値とは、正負の符号を無視した値のことです。次に、本当の値それぞれと、本当の値全体の平均との差の絶対値を計算し、それらを平均します。最後に、最初の値をこの値で割ることで、RSEが算出されます。
RSEは常に0以上の値になります。そして、RSEの値が小さいほど、予測の精度が高いことを示します。もしRSEが0であれば、それは予測が完全に当たっている、つまり予測値と本当の値が全く同じであることを意味します。RSEが0に近いほど、モデルの予測はより正確で、モデルの性能が良いと言えるでしょう。