R-CNN:物体検出の革新
「候補領域の選定」とは、画像の中から物体が写っているであろう場所を絞り込む作業のことです。この作業は、まるで宝探しをする前に、宝が埋まっている可能性の高い場所を地図上でいくつか印をつけるようなものです。この印をつけた場所一つ一つを「候補領域」と呼び、四角形で表現します。
この候補領域を見つけるために、「選択的探索」と呼ばれる手法がよく使われます。この手法は、まるでジグソーパズルを組み立てるように、画像の色や模様といった特徴が似ている小さな領域を少しずつ繋げて、より大きなまとまりを作っていきます。例えば、青い空と白い雲、または赤いリンゴと緑の葉っぱといった具合です。そして、最終的に出来上がったまとまりを四角形で囲み、候補領域として抽出します。
この選択的探索を使う利点は、画像全体をくまなく調べる必要がないという点です。宝探しの例で言えば、山全体を探すのではなく、宝の地図に印がついている場所に絞って探すようなものです。これにより、処理の効率が大幅に向上します。しかし、この手法にも欠点があります。場合によっては、数百から数千個もの候補領域が抽出されることがあるのです。これは、宝の地図に印が多すぎて、結局どこを探せば良いのかわからなくなってしまうようなものです。つまり、候補領域が多すぎると、その後の処理に時間がかかってしまう可能性があるのです。そのため、候補領域の数を適切に絞り込む工夫が重要になります。