マクロ平均

記事数:(2)

機械学習

マイクロF1値:機械学習の評価指標

「マイクロF1値」とは、機械学習、とりわけ、物事をいくつかの種類に仕分ける問題において、作った仕分け機の良し悪しを測るための大切な物差しです。この物差しは、仕分け機の仕分けの正確さを示す数値で、0から1までの間の値になります。1に近いほど、仕分け機がうまく仕分けできていることを表します。「マイクロF1値」は、特に、仕分けの対象となるデータの種類ごとに数が大きく違う場合に役立ちます。 例えば、ある病気かどうかを診断する仕分け機を作るとします。この時、病気の人のデータと健康な人のデータの数が大きく異なることが考えられます。このような場合、全体の正答率だけを見ると、数の多い方の種類のデータの仕分けの正確さに引っ張られて、数の少ない方の種類のデータの仕分けの正確さが低くても、全体としては高い正答率が出てしまうことがあります。「マイクロF1値」は、それぞれの種類のデータについて、正しく仕分けできた数、間違って仕分けした数などを全体で合計して計算されるので、データの数の偏りに影響されにくく、より信頼できる物差しとなります。 言い換えると、「マイクロF1値」は、それぞれのデータの種類にとらわれず、全体的な仕分けの正確さを測ることに重きを置いています。例えば、りんご、みかん、いちごを仕分ける仕分け機を作ったとします。りんごの数が非常に多く、みかんといちごの数が少ないとします。全体の正答率は、りんごの仕分けの正確さに大きく影響されます。しかし、「マイクロF1値」は、りんご、みかん、いちご、それぞれの仕分けの正確さを均等に評価します。つまり、たとえりんごの仕分けの正確さが高くても、みかんといちごの仕分けの正確さが低い場合、「マイクロF1値」は低い値を示すのです。このように、「マイクロF1値」は、データの偏りに左右されずに、仕分け機の真の実力を測るための、信頼できる物差しと言えるでしょう。
機械学習

マクロF1値:多クラス分類の評価指標

複数の種類に分ける作業で、機械学習の成果を測る物差しの一つに、マクロF1値というものがあります。これは、例えば、写真を見てそれが猫か犬か人間かを当てるような問題、迷惑メールを見分ける、お客さんをグループに分けるといった時に役立ちます。 特に、三つ以上の種類に分ける場合、それぞれの種類の正解率をまとめて評価する必要があります。このマクロF1値は、まさにそのための物差しです。それぞれの種類の正解率を測るF1値というものをまず計算し、それらの平均値を算出することで、全体的な性能を測ります。 この方法の利点は、データの偏りに左右されにくいことです。つまり、ある種類のデータが非常に多くても、その種類の正解率だけが全体の評価に過剰な影響を与えることはありません。例えば、犬の写真が大量にあって、猫や人間のデータが少ない場合でも、猫や人間の認識精度が低くても、犬の認識精度が高ければ全体の評価が高くなってしまう、ということが起きにくくなります。 それぞれの種類の正解率を平等に評価できるため、データの数が種類によって大きく異なる場合でも、信頼できる評価結果を得られます。このことから、マクロF1値は、現実世界の様々な問題に適用できる、とても便利な物差しと言えるでしょう。