機械学習の指標:平均二乗対数誤差
平均二乗対数誤差(略して平均二乗対数誤差)は、機械学習の分野で、作った模型の良し悪しを測るものさしの一つです。特に、本当の値と予想した値の比率がどれくらい合っているかを重視したい時に使われます。
よく似たものさしに、平均二乗誤差というものがあります。これは、本当の値と予想した値の差を二乗して、その平均を計算します。一方、平均二乗対数誤差は、本当の値と予想した値のそれぞれに対数をとってから、その差を二乗し、平均を計算します。
対数を使うことで、本当の値と予想した値の比率の違いに注目することができます。例えば、本当の値が100で予想した値が110の場合と、本当の値が10で予想した値が11の場合を比べてみましょう。平均二乗誤差では、この二つの場合の誤差は大きく異なります。しかし、平均二乗対数誤差では、ほぼ同じ誤差として扱われます。これは、どちらも本当の値に対して1.1倍ずれているからです。つまり、平均二乗対数誤差は、値の大きさそのものの違いよりも、比率の違いを重視していると言えるでしょう。
この特徴から、平均二乗対数誤差は、商品の売上の予想や、サービスの需要予想など、予想した値の比率が重要な仕事でよく使われます。例えば、来月の売上を予想する際に、100万円の売上を110万円と予想した場合と、10万円の売上を11万円と予想した場合では、金額の差は大きく異なりますが、比率のずれは同じです。このような場合、平均二乗対数誤差を用いることで、比率のずれを適切に評価することができます。また、対数をとることで、極端に大きな値や小さな値の影響を抑えることもできます。