画像認識精度向上のためのランダム消去
物の姿形を機械に教える画像認識では、学習に使う絵の数が多ければ多いほど、機械は賢くなります。しかし、たくさんの絵を集めるのは大変な作業です。そこで、少ない絵から人工的に新しい絵を作り出す技術が生まれました。これをデータ拡張と言います。ランダム消去はこのデータ拡張の一つで、まるでいたずら書きのように絵の一部を塗りつぶすことで、新しい絵を作り出します。
具体的には、四角い枠で絵の一部を覆い隠します。この四角の大きさや位置は毎回ランダム、つまり偶然に決められます。隠す時に使う色も、毎回変わります。そのため、同じ絵であっても、何度もランダム消去を繰り返すと、毎回異なる部分が異なる色で塗りつぶされ、たくさんの違った絵ができあがります。
一見すると、絵を塗りつぶす行為は、絵を壊しているように思えます。しかし、この一見破壊的な行為が、画像認識の学習には大きな効果をもたらします。なぜなら、一部が隠された絵を学習することで、機械は隠された部分を想像して補完する能力を身につけます。例えば、猫の絵の顔が隠されていても、耳や体を見て猫だと判断できるようになるのです。
また、ランダム消去は過学習を防ぐ効果もあります。過学習とは、機械が学習用の絵に特化しすぎてしまい、新しい絵を正しく認識できなくなる現象です。ランダム消去によって絵の一部を変化させることで、機械は特定の絵に過度に適応することを防ぎ、より汎用的な認識能力を獲得できます。つまり、様々なバリエーションの絵を学習することで、見たことのない新しい絵にも対応できるようになるのです。