分類の難しさ:みにくいアヒルの子定理
「みにくいアヒルの子」と言うと、多くの人がアンデルセンの童話を思い浮かべるでしょう。お話の中では、後に白鳥だと分かるまで、灰色の子鳥は仲間はずれにされ、みにくいアヒルの子と呼ばれていました。ところが、人工知能の分野では、この童話にちなんだ「みにくいアヒルの子定理」と呼ばれる、興味深い考え方が存在します。これは、ものの類似性を考える上で、私たちの直感を揺るがす内容を含んでいます。
この定理は、「みにくいアヒルの子と普通のアヒルの子は、二匹の普通のアヒルの子と同じくらい似ている」と主張します。少し分かりにくいので、具体的に考えてみましょう。みにくいアヒルの子をA、二匹の普通のアヒルの子をBとCとします。AとBの間には、例えば「鳥である」という共通点があります。AとCの間にも「卵から生まれた」という共通点がありますし、BとCにも「水かきがある」という共通点を見つけることができます。
もちろん、AとBだけに共通する点も存在します。例えば、Aは灰色ではないのに対し、BとCは灰色です。つまり、「灰色ではない」という特徴はAとBだけに共通します。同じように、AとCだけに共通する特徴、BとCだけに共通する特徴も見つけることができます。例えば、AとCは「くちばしが黄色い」という共通点を持つかもしれませんし、BとCは「同じ群れにいる」という共通点を持つかもしれません。
このように、どの二つの組み合わせにも、共通する特徴、異なる特徴が存在します。重要なのは、比較の基準をどこに置くかです。もし「灰色である」という特徴を重視すれば、AはBやCとは異質なものに見えます。しかし、「鳥である」「卵から生まれた」といった特徴を重視すれば、AもBもCも似たもの同士と言えるでしょう。つまり、どの二つのアヒルの子を選んでも、同じくらいの数の共通点と相違点を見つけることができるため、どれも同じくらい似ていると、この定理は主張しているのです。これは、私たちが普段、無意識のうちに特定の特徴を重視して類似性を判断していることを示唆しています。人工知能においては、どのような特徴を基準に類似性を判断するかが重要になるため、この定理は重要な意味を持ちます。