Random Erasing

記事数:(2)

深層学習

ランダムイレーシング:画像認識の精度向上

画像認識の分野では、学習に用いる画像データを増やすことで認識精度を向上させる、データ拡張という手法がよく使われます。ランダムイレーシングもこのデータ拡張の一つであり、画像に部分的な欠損を作り出すことで、モデルの頑健性を高めることを目的としています。 この手法は、まるで子供がいたずら書きで絵の一部を塗りつぶすように、画像の一部分を四角形で覆い隠します。この覆い隠す四角形は、大きさも位置も様々です。覆い隠す四角形の大きさは画像全体に対してランダムに決定され、時には小さく、時には大きく設定されます。また、覆い隠す位置も画像のどこであっても構いません。中央付近に配置されることもあれば、端の方に寄ることもあります。 そして、この四角形で覆われた部分の画素の値は、ランダムな値に置き換えられます。つまり、隠された部分は単一の色で塗りつぶされるのではなく、様々な色の点で構成された、一見ノイズのように見える状態になるのです。 このように画像の一部を意図的に欠損させることで、何が起きるのでしょうか。モデルは、完全な情報が得られない状況でも、画像に写っているものを正しく認識することを強いられます。部分的に情報が欠けていても、残された情報から全体像を推測し、正しい答えを導き出す訓練を積むわけです。この訓練を通して、モデルは特定の部分的な特徴に過度に依存するのではなく、画像全体の文脈を理解する能力を身につけるのです。結果として、多少の情報が欠損していても、あるいは被写体の一部が隠れていても、正しく認識できる、より頑健なモデルが完成します。
深層学習

画像認識精度向上のためのランダム消去

物の姿形を機械に教える画像認識では、学習に使う絵の数が多ければ多いほど、機械は賢くなります。しかし、たくさんの絵を集めるのは大変な作業です。そこで、少ない絵から人工的に新しい絵を作り出す技術が生まれました。これをデータ拡張と言います。ランダム消去はこのデータ拡張の一つで、まるでいたずら書きのように絵の一部を塗りつぶすことで、新しい絵を作り出します。 具体的には、四角い枠で絵の一部を覆い隠します。この四角の大きさや位置は毎回ランダム、つまり偶然に決められます。隠す時に使う色も、毎回変わります。そのため、同じ絵であっても、何度もランダム消去を繰り返すと、毎回異なる部分が異なる色で塗りつぶされ、たくさんの違った絵ができあがります。 一見すると、絵を塗りつぶす行為は、絵を壊しているように思えます。しかし、この一見破壊的な行為が、画像認識の学習には大きな効果をもたらします。なぜなら、一部が隠された絵を学習することで、機械は隠された部分を想像して補完する能力を身につけます。例えば、猫の絵の顔が隠されていても、耳や体を見て猫だと判断できるようになるのです。 また、ランダム消去は過学習を防ぐ効果もあります。過学習とは、機械が学習用の絵に特化しすぎてしまい、新しい絵を正しく認識できなくなる現象です。ランダム消去によって絵の一部を変化させることで、機械は特定の絵に過度に適応することを防ぎ、より汎用的な認識能力を獲得できます。つまり、様々なバリエーションの絵を学習することで、見たことのない新しい絵にも対応できるようになるのです。