マイクロF1値:機械学習の評価指標
「マイクロF1値」とは、機械学習、とりわけ、物事をいくつかの種類に仕分ける問題において、作った仕分け機の良し悪しを測るための大切な物差しです。この物差しは、仕分け機の仕分けの正確さを示す数値で、0から1までの間の値になります。1に近いほど、仕分け機がうまく仕分けできていることを表します。「マイクロF1値」は、特に、仕分けの対象となるデータの種類ごとに数が大きく違う場合に役立ちます。
例えば、ある病気かどうかを診断する仕分け機を作るとします。この時、病気の人のデータと健康な人のデータの数が大きく異なることが考えられます。このような場合、全体の正答率だけを見ると、数の多い方の種類のデータの仕分けの正確さに引っ張られて、数の少ない方の種類のデータの仕分けの正確さが低くても、全体としては高い正答率が出てしまうことがあります。「マイクロF1値」は、それぞれの種類のデータについて、正しく仕分けできた数、間違って仕分けした数などを全体で合計して計算されるので、データの数の偏りに影響されにくく、より信頼できる物差しとなります。
言い換えると、「マイクロF1値」は、それぞれのデータの種類にとらわれず、全体的な仕分けの正確さを測ることに重きを置いています。例えば、りんご、みかん、いちごを仕分ける仕分け機を作ったとします。りんごの数が非常に多く、みかんといちごの数が少ないとします。全体の正答率は、りんごの仕分けの正確さに大きく影響されます。しかし、「マイクロF1値」は、りんご、みかん、いちご、それぞれの仕分けの正確さを均等に評価します。つまり、たとえりんごの仕分けの正確さが高くても、みかんといちごの仕分けの正確さが低い場合、「マイクロF1値」は低い値を示すのです。このように、「マイクロF1値」は、データの偏りに左右されずに、仕分け機の真の実力を測るための、信頼できる物差しと言えるでしょう。