評価指標

記事数:(50)

機械学習

マクロF1値:多クラス分類の評価指標

複数の種類に分ける作業で、機械学習の成果を測る物差しの一つに、マクロF1値というものがあります。これは、例えば、写真を見てそれが猫か犬か人間かを当てるような問題、迷惑メールを見分ける、お客さんをグループに分けるといった時に役立ちます。 特に、三つ以上の種類に分ける場合、それぞれの種類の正解率をまとめて評価する必要があります。このマクロF1値は、まさにそのための物差しです。それぞれの種類の正解率を測るF1値というものをまず計算し、それらの平均値を算出することで、全体的な性能を測ります。 この方法の利点は、データの偏りに左右されにくいことです。つまり、ある種類のデータが非常に多くても、その種類の正解率だけが全体の評価に過剰な影響を与えることはありません。例えば、犬の写真が大量にあって、猫や人間のデータが少ない場合でも、猫や人間の認識精度が低くても、犬の認識精度が高ければ全体の評価が高くなってしまう、ということが起きにくくなります。 それぞれの種類の正解率を平等に評価できるため、データの数が種類によって大きく異なる場合でも、信頼できる評価結果を得られます。このことから、マクロF1値は、現実世界の様々な問題に適用できる、とても便利な物差しと言えるでしょう。
機械学習

物体検出の精度指標:mAPとは

画像や動画に映る特定のものを探し出し、その場所を特定する技術、それが物体検出です。この技術の良し悪しを測るには様々な方法がありますが、中でも平均適合率(mAP)は重要な指標です。mAPは0から1までの数値で表され、1に近いほど、その検出の正確さが高いことを示します。 物体検出の仕組みを簡単に説明すると、まずモデルが画像の中から「これは探しているものかもしれない」という部分を提案します。これを予測と言います。次に、その予測が実際に探しているものとどの程度一致しているかを評価します。ここで適合率という指標が登場します。適合率は、予測がどれだけ正確かを表す数値です。しかし、適合率だけでは、本当に探しているものを見逃していないかを判断できません。そこで、再現率という指標も用います。再現率は、実際に画像に写っている探しているもののうち、どれだけの割合を正しく見つけられたかを表します。 mAPは、この適合率と再現率を組み合わせた指標です。様々な条件で適合率と再現率を計算し、その平均を取ることによって、モデルの全体的な性能を評価します。mAPが1に近いほど、より多くのものを、より正確に見つけられると言えるでしょう。 例えば、自動運転技術には、歩行者や車などを正確に見つけることが不可欠です。そのため、自動運転に用いる物体検出モデルには高いmAP値が求められます。mAP値が高いほど、より安全な自動運転を実現できるからです。近年、深層学習技術の進歩によって物体検出の精度は大きく向上し、それに伴い、このmAPの重要性もますます高まっています。