残差平方和:モデルの精度を測る
統計や機械学習の世界では、予測モデルの良し悪しを測る物差しが必要です。その物差しの一つに、残差平方和というものがあります。これは、モデルがどれほど観測データに合致しているかを表す数値です。この数値が小さいほど、モデルの予測精度は高いと判断できます。
では、残差平方和とは具体的にどのように計算するのでしょうか。まず、個々のデータを見ていきます。ある時点での商品の実際の売上と、モデルが予測した売上の差を計算します。この差を残差と呼びます。残差はプラスの場合もあればマイナスの場合もあります。そのまま合計してしまうと、プラスとマイナスが打ち消し合ってしまい、全体のずれの大きさが正しく測れません。そこで、それぞれの残差を二乗します。二乗することで、すべての残差が正の値になり、打ち消し合いの問題がなくなります。これらの二乗した残差をすべて合計したものが、残差平方和です。
例えば、ある商品の来月の売上を予測するモデルを作ったとしましょう。過去の売上データとモデルを使って、来月の売上の予測値を計算します。そして実際に来月が終わった後に、実際の売上データが手に入ったら、予測値と実際の売上の差、つまり残差を計算します。それぞれの日の残差を二乗し、それを合計することで残差平方和が求まります。もし残差平方和が小さければ、モデルが日々の売上の変化をよく捉え、精度の高い予測ができていると解釈できます。逆に残差平方和が大きければ、モデルの予測精度が低いと考えられます。つまり、モデルが実際の売上の動きをうまく捉えられていないということです。このように、残差平方和はモデルの精度を評価する上で重要な指標となります。