マイクロ平均

記事数:(2)

機械学習

マイクロ平均:性能評価の新基準

マイクロ平均とは、機械学習の分類モデルの良し悪しを測るための大切な物差しです。マイクロ平均は、たくさんの種類に分ける問題で、全体を見てどれくらい正確に分けられたかを計算します。一つ一つの種類の正解率を別々に計算するのではなく、全ての正解数をまとめて計算するのです。 具体的には、まずデータ全体で、実際に正解で予測も正解だった数(真陽性)、実際は間違いなのに正解と予測した数(偽陽性)、実際は正解なのに間違いと予測した数(偽陰性)をそれぞれ数えます。次に、これらの数を用いて、どれくらい正確に予測できたか(精度)、どれくらい正解を見逃さずに予測できたか(再現率)、精度と再現率のバランスを示す値(F1スコア)などを計算します。 マイクロ平均を使う大きな利点は、データの偏りに影響されにくいことです。例えば、ある種類のデータ数がとても少ない場合、その種類の予測がうまくいかなくても、マイクロ平均の値にはあまり影響しません。これは、マイクロ平均がデータ全体を見て判断するためです。もし、種類ごとに分けて正解率を計算すると、データ数が少ない種類の正解率が全体の評価を大きく左右してしまう可能性があります。マイクロ平均は、このような問題を避けることができるのです。 マイクロ平均は、どの種類も同じくらい重要だと考える場合に特に役立ちます。もし、ある種類を特に重視する必要がある場合は、マイクロ平均ではなく、種類ごとの重み付けをした平均を使うなどの工夫が必要です。しかし、多くの場合、マイクロ平均は分類モデルの性能を簡単に、そして公平に評価するための便利な指標と言えるでしょう。
機械学習

マイクロF1値:機械学習の評価指標

「マイクロF1値」とは、機械学習、とりわけ、物事をいくつかの種類に仕分ける問題において、作った仕分け機の良し悪しを測るための大切な物差しです。この物差しは、仕分け機の仕分けの正確さを示す数値で、0から1までの間の値になります。1に近いほど、仕分け機がうまく仕分けできていることを表します。「マイクロF1値」は、特に、仕分けの対象となるデータの種類ごとに数が大きく違う場合に役立ちます。 例えば、ある病気かどうかを診断する仕分け機を作るとします。この時、病気の人のデータと健康な人のデータの数が大きく異なることが考えられます。このような場合、全体の正答率だけを見ると、数の多い方の種類のデータの仕分けの正確さに引っ張られて、数の少ない方の種類のデータの仕分けの正確さが低くても、全体としては高い正答率が出てしまうことがあります。「マイクロF1値」は、それぞれの種類のデータについて、正しく仕分けできた数、間違って仕分けした数などを全体で合計して計算されるので、データの数の偏りに影響されにくく、より信頼できる物差しとなります。 言い換えると、「マイクロF1値」は、それぞれのデータの種類にとらわれず、全体的な仕分けの正確さを測ることに重きを置いています。例えば、りんご、みかん、いちごを仕分ける仕分け機を作ったとします。りんごの数が非常に多く、みかんといちごの数が少ないとします。全体の正答率は、りんごの仕分けの正確さに大きく影響されます。しかし、「マイクロF1値」は、りんご、みかん、いちご、それぞれの仕分けの正確さを均等に評価します。つまり、たとえりんごの仕分けの正確さが高くても、みかんといちごの仕分けの正確さが低い場合、「マイクロF1値」は低い値を示すのです。このように、「マイクロF1値」は、データの偏りに左右されずに、仕分け機の真の実力を測るための、信頼できる物差しと言えるでしょう。