中央値:データの中心を掴む
真ん中の値のことです。データの大きさの順に並べたときに、ちょうど真ん中にあたる値のことです。中央値は、データの中心的な傾向を示す指標のひとつであり、平均値とともに使われることがよくあります。
データの数が奇数のときは、真ん中の値がそのまま中央値になります。たとえば、1、3、5、7、9という5つのデータがあったとします。これらのデータを小さい順に並べると、1、3、5、7、9となります。このとき、真ん中の値は5なので、中央値は5となります。
一方、データの数が偶数のときは、真ん中の2つの値の平均値を中央値とします。たとえば、1、3、5、7という4つのデータがあったとします。これらのデータを小さい順に並べると、1、3、5、7となります。このとき、真ん中の2つの値は3と5です。これらの平均値は(3+5)÷2=4 なので、中央値は4となります。
中央値を使う利点は、極端に大きい値や小さい値の影響を受けにくいことです。たとえば、1、2、3、4、100というデータがあったとします。このデータの平均値は22ですが、100という極端に大きい値に引っ張られています。一方、中央値は3なので、100という値の影響をあまり受けていません。このように、一部の極端な値に影響されにくい指標を求めたい場合は、中央値が役立ちます。
まとめると、中央値はデータを大きさの順に並べたときの真ん中の値です。データの数が奇数の場合は真ん中の値、偶数の場合は真ん中2つの値の平均値を中央値とします。中央値は、平均値と並んでデータの中心的な傾向を示す指標としてよく用いられ、極端な値の影響を受けにくいという特徴があります。