高速物体検出:Fast R-CNN
近年、計算機による画像認識技術がめざましい発展を見せており、中でも画像内の対象物を探し出す技術は目覚ましい進歩を遂げています。この技術は、写真や動画の中から特定のものを探し出し、それが何であるかを判断するものです。例えば、自動運転の分野では、周囲の車や歩行者、信号などを認識するために必要不可欠です。また、医療の現場では、レントゲン写真から異常箇所を発見する際に役立っています。さらに、製造業では、製品の欠陥を自動で見つける検査工程に活用されています。このように、対象物を探し出す技術は、暮らしの様々な場面で利用されており、ますます重要度を増しています。
この技術は、大きく分けて二つの段階で処理を行います。まず、画像の中から対象物らしきものが写っている場所を大まかに特定します。そして、特定された場所について、それが本当に目的の対象物であるかどうか、また、それが何であるかを詳しく調べます。このような処理を行うことで、画像全体をくまなく調べるよりも効率的に対象物を探し出すことができます。
今回紹介する「高速領域畳み込みニューラルネットワーク(高速領域畳み込みニューラル網)」は、このような対象物検出技術の中でも、特に処理速度の速さに重点を置いた手法です。従来の手法では、画像の中から対象物らしき場所を一つずつ切り出して調べていましたが、この手法では、画像全体を一度に処理することで、大幅な高速化を実現しています。この高速化により、動画のような連続した画像に対してもリアルタイムで対象物を検出することが可能になり、自動運転やロボット制御など、様々な応用が期待されています。この手法の詳しい仕組みについては、次の章で詳しく説明します。