再現率:機械学習の指標
機械学習の分野、特にものを仕分ける問題において、どれくらい正確に見つけられているかを測る大切な尺度の一つに、再現率というものがあります。これは、本来見つけるべきもののうち、実際にどれだけの割合を見つけられたかを示す数値です。
例えば、健康診断で病気を発見する検査を考えてみましょう。実際に病気にかかっている人たちの集団を思い浮かべてください。この中で、検査によって正しく病気だと診断された人の割合が再現率です。言い換えると、病気の人を見落とさずに、どれだけの割合で正しく診断できたかを表しています。
もう少し具体的に説明するために、りんご農園でのりんごの収穫を例に挙げてみましょう。熟したりんごだけを収穫したいとします。熟したりんご全体を「実際に収穫すべきりんご」とします。収穫作業の後、集められたりんごの中に、熟したりんごがいくつか含まれていました。この「集められた熟したりんご」が「正しく収穫されたりんご」です。この時、実際に木になっている熟したりんご全体の中で、どれだけの割合を収穫できたかを計算したものが再現率です。もし、熟したりんごが100個木になっているにも関わらず、収穫された熟したりんごが80個だった場合、再現率は80%となります。
再現率は0から1までの値で表され、1に近いほど見落としが少ない、つまり性能が良いと判断されます。もし再現率が1であれば、見つけるべきものは全て漏れなく見つけられたことを意味します。反対に、再現率が0に近い場合は、見つけるべきもののほとんどが見落とされていることを意味し、検査やモデルの改善が必要となります。このように、再現率は、機械学習モデルの性能評価において重要な役割を果たす指標です。