統計量

記事数:(2)

アルゴリズム

平均絶対偏差:データのばらつきを測る

情報を詳しく調べたり整理したりする作業の中で、データがどれくらい散らばっているかを理解することはとても大切です。平均値だけではデータの全体像を捉えきれない場合がよくあります。例えば、ある地域の平均年収が500万円だったとしましょう。一見すると、そこそこ豊かな地域のように思えますが、実は少数の高所得者によって平均値が押し上げられているかもしれません。大部分の住民は年収300万円で、ごく一部の人が1000万円以上の年収を得ている可能性も考えられます。このような状況では、平均年収という一つの数字だけで判断すると、実態を見誤ってしまう危険性があります。 そこで、データの散らばり具合を測る尺度として、平均絶対偏差が役に立ちます。平均絶対偏差とは、それぞれのデータが平均値からどれくらい離れているかを平均した値です。具体的な計算方法は、まず各データと平均値の差を計算します。次に、その差の絶対値を求めます。絶対値とは、マイナスの符号を取り除いた値のことです。最後に、これらの絶対値をすべて足し合わせ、データの個数で割ります。こうして求められた平均絶対偏差は、データの散らばり具合を直感的に理解するのに役立ちます。平均絶対偏差が大きいほど、データは平均値から遠く離れた値が多く、散らばりが大きいことを示しています。逆に、平均絶対偏差が小さい場合は、データは平均値の近くに集まっており、散らばりが小さいことを意味します。 平均絶対偏差を理解することで、データの分布や特徴をより深く把握することができます。平均値だけでなく、平均絶対偏差も合わせて見ることで、データの背後にある真の姿が見えてきます。例えば、二つの地域の平均年収が同じでも、平均絶対偏差が大きく異なる場合があります。これは、収入の分布に大きな違いがあることを示唆しています。平均絶対偏差を用いることで、このような違いを明確に捉えることができるのです。
分析

推測統計学:未知の世界を知る

推測統計学は、全体の様子を知りたいけれど、全部を調べることは難しい時に役立つ統計学の分野です。池にいる鯉の数を全部数えるのは大変ですが、一部の鯉を捕まえて印をつけて池に戻し、しばらくしてからまた一部の鯉を捕まえることで、印のついた鯉の割合から全体の鯉の数を推測できます。この例のように、推測統計学では、全体のことを母集団、一部のデータのことを標本と呼びます。推測統計学の目的は、標本から母集団の特徴を推測することです。 例えば、新しいお菓子の味が消費者に好まれるかを調べたいとします。全員に試食してもらうのは費用と時間がかかります。そこで、一部の人たちに試食してもらい、その結果から全体の人たちが好むかどうかを推測します。この場合、試食してもらった人たちが標本、全体の人たちが母集団となります。標本から得られた「おいしい」と答えた人の割合を使って、母集団全体で「おいしい」と思う人の割合を推測します。これが推測統計学の考え方です。 推測統計学では、平均や分散といった値を使って母集団の特徴を推測します。標本から計算した平均や分散は、母集団の平均や分散と完全に一致するとは限りません。しかし、統計学的な手法を用いることで、ある程度の確からしさを持って推測することができます。例えば、「95%の確信を持って、母集団の平均は○○から○○の間にある」といった形で推定を行います。つまり、100回同じ調査をしたら95回はその範囲に真の値が含まれている、という意味です。推測統計学は、限られた情報から全体像を把握するための強力な道具であり、市場調査や品質管理など、様々な分野で活用されています。