人工知能の学習を支える特徴量
人工知能、特に機械学習という分野では、コンピュータにたくさんの情報を覚えさせて、次に何が起こるかを予想させたり、ものの種類を見分けさせたりといった作業を行います。この作業を学習と呼びますが、学習のためには、覚えさせる情報を数字で表す必要があります。この数字のことを「特徴量」と言います。
たとえば、りんご、みかん、バナナを見分ける人工知能を作るとしましょう。この人工知能に、りんご、みかん、バナナの特徴をそれぞれ数字で教えてあげる必要があります。りんごの特徴として考えられるのは、色、大きさ、形、重さなどです。たとえば、「赤い」という色は数字で表せませんので、「赤い」を「1」と表し、「青い」を「2」と表す、といったルールを決めます。そして、りんごの色が「赤い」場合は「1」という数字を人工知能に教えます。
大きさも数字で表すことができます。ものの大きさを表すには、ふつう、直径や半径を使います。たとえば、りんごの直径が8センチであれば、「8」という数字を人工知能に教えます。形も数字で表すことができます。たとえば、「丸い」を「1」、「長い」を「2」と決めて、りんごの形が「丸い」場合は「1」を人工知能に教えます。重さも同じように、りんごの重さが150グラムであれば「150」という数字を人工知能に教えます。
このように、色、大きさ、形、重さを数字で表した「1」、「8」、「1」、「150」といった数字が、りんごの特徴量です。みかんやバナナにも、それぞれの色、大きさ、形、重さを数字で表して、人工知能に教えます。人工知能は、これらの数字、つまり特徴量を通して、りんご、みかん、バナナの特徴を理解し、これらの果物を見分ける方法を学習していきます。
特徴量は、人工知能の学習にとってなくてはならないものです。そして、人工知能にどのような特徴量を覚えさせるかによって、人工知能の賢さが大きく変わってきます。良い特徴量を選ぶこと、あるいは良い特徴量を作り出すことは、人工知能の研究における重要な課題の一つです。