適合率:予測精度を測る指標
機械学習の分野では、予測モデルの良し悪しを測る物差しがいくつかあります。その中で、『適合率』という尺度は、モデルの正確さを測る重要な指標の一つです。具体的に言うと、ある事柄を『そうだ』と予測した中で、実際に『そうだ』であったものの割合を示すのが適合率です。
例として、迷惑メールのフィルターを考えてみましょう。日々届くメールの山の中から、迷惑メールを自動で見分けてくれる便利な機能です。このフィルターが、迷惑メールだと判断したメールの中に、本当に迷惑メールが含まれている割合が、まさに適合率に当たります。迷惑メールではない普通のメールを、間違って迷惑メールだと判断してしまう、いわゆる『誤り』が少ないほど、適合率は高くなります。
別の例として、病気の診断を考えてみましょう。ある病気の検査で「陽性」と判定された人のうち、実際にその病気を患っている人の割合が適合率です。つまり、本当に病気の人を正しく診断できた割合を示しています。検査で「陰性」と判定されたにも関わらず、実際には病気を患っている「偽陰性」は、適合率には影響しません。適合率はあくまでも「陽性」と判定された人のみに焦点を当てています。
適合率は、0から1の間の値で表されます。1に近いほど正確な予測であることを示し、逆に0に近いと予測の精度は低いと言えます。例えば、適合率が0.9の場合、予測が当たっている割合は9割です。0.5の場合は、半分の予測しか当たっていないことになります。このように、適合率はモデルの性能を評価する上で、非常に重要な役割を果たしています。