残差平方和:モデルの精度を測る
統計や機械学習の世界では、作った模型がどれくらい実際のデータに合っているかを知ることが大切です。そのために「残差平方和」という尺度がよく使われます。この残差平方和とは、模型の良し悪しを数字で表すもので、数字が小さいほど模型の精度が高いことを示します。
では、どのようにしてこの数字を計算するのでしょうか。まず、あるデータについて、実際の値と模型が予測した値を比べます。この二つの値の差を「残差」と言います。次に、それぞれのデータの残差を二乗します。そして、最後に、全てのデータの二乗した残差を合計します。これが残差平方和です。
残差を二乗するのは、プラスのずれとマイナスのずれを区別せずに、ずれの大きさだけを評価するためです。例えば、あるデータで実際の値が10、予測値が8の場合、残差は2です。別のデータで実際の値が10、予測値が12の場合、残差は-2です。これらの残差をそのまま足すと0になってしまいますが、二乗することでどちらも4となり、ずれの大きさを正しく捉えることができます。
例えば、家の値段を予測する模型を作ったとします。この模型を使って、色々な家の値段を予測します。そして、実際の売買価格と模型が予測した価格を比べて、それぞれの残差を計算し、二乗して合計します。この合計値が小さければ小さいほど、作った模型は家の値段をよく予測できていると言えるでしょう。
このように、残差平方和は模型の精度を測る重要な指標であり、より精度の高い模型を作るために欠かせないものです。どの模型が良いかを選んだり、模型の細かい調整をしたりする際に、残差平方和は役立ちます。