マイクロ平均:性能評価の新基準
マイクロ平均とは、機械学習の分類モデルの良し悪しを測るための大切な物差しです。マイクロ平均は、たくさんの種類に分ける問題で、全体を見てどれくらい正確に分けられたかを計算します。一つ一つの種類の正解率を別々に計算するのではなく、全ての正解数をまとめて計算するのです。
具体的には、まずデータ全体で、実際に正解で予測も正解だった数(真陽性)、実際は間違いなのに正解と予測した数(偽陽性)、実際は正解なのに間違いと予測した数(偽陰性)をそれぞれ数えます。次に、これらの数を用いて、どれくらい正確に予測できたか(精度)、どれくらい正解を見逃さずに予測できたか(再現率)、精度と再現率のバランスを示す値(F1スコア)などを計算します。
マイクロ平均を使う大きな利点は、データの偏りに影響されにくいことです。例えば、ある種類のデータ数がとても少ない場合、その種類の予測がうまくいかなくても、マイクロ平均の値にはあまり影響しません。これは、マイクロ平均がデータ全体を見て判断するためです。もし、種類ごとに分けて正解率を計算すると、データ数が少ない種類の正解率が全体の評価を大きく左右してしまう可能性があります。マイクロ平均は、このような問題を避けることができるのです。
マイクロ平均は、どの種類も同じくらい重要だと考える場合に特に役立ちます。もし、ある種類を特に重視する必要がある場合は、マイクロ平均ではなく、種類ごとの重み付けをした平均を使うなどの工夫が必要です。しかし、多くの場合、マイクロ平均は分類モデルの性能を簡単に、そして公平に評価するための便利な指標と言えるでしょう。