最短距離法:データの集まりを近づける
ものの集まりをいくつかの種類に分ける方法の一つに、最短距離法というものがあります。この方法は、それぞれの集まりの間にある離れ具合を測るために、集まりに属するもののうち、最も近いもの同士の距離を使います。
たとえば、東京の人の集まりと大阪の人の集まりを考えます。東京に住む人と大阪に住む人の中で、渋谷駅にいる人と梅田駅にいる人が最も近いとします。すると、東京の人たちの集まりと大阪の人たちの集まりの間の距離は、渋谷駅と梅田駅の距離として扱われます。このように、集まりの間の距離を、最も近いもの同士の距離で表すので、最短距離法と呼ばれています。
この方法は、ものの集まりを段階的に分けていく時によく使われます。分ける過程で、ものの集まりがだんだん一つにまとまっていく様子を、木の枝のように表すことができます。この木の枝のような図を樹形図といいます。
また、最短距離法は単連結法とも呼ばれます。これは、集まり同士が最も近いもの一つだけでつながっているように見えるからです。言い換えると、集まり同士のつながりが最も弱い部分を基準にして距離を測っているとも考えられます。
たとえば、いくつかの町をいくつかのグループに分けたいとします。それぞれの町から最も近い町を探し、その距離を測ります。最も距離が近い町同士を一つのグループにまとめます。次に、そのグループと他の町、もしくはグループ同士の距離を測り、また最も近いもの同士をまとめます。これを繰り返していくことで、最終的にすべての町を一つのグループにまとめることができます。そして、その過程を樹形図で表すことで、どの町がどの町と近く、どのようにグループ分けされていくのかを視覚的に理解することができます。このように、最短距離法は、ものの集まりを視覚的にわかりやすく分類するために役立つ方法です。