検定

記事数:(2)

分析

推測統計学:未知の世界を知る

推測統計学は、全体の様子を知りたいけれど、全部を調べることは難しい時に役立つ統計学の分野です。池にいる鯉の数を全部数えるのは大変ですが、一部の鯉を捕まえて印をつけて池に戻し、しばらくしてからまた一部の鯉を捕まえることで、印のついた鯉の割合から全体の鯉の数を推測できます。この例のように、推測統計学では、全体のことを母集団、一部のデータのことを標本と呼びます。推測統計学の目的は、標本から母集団の特徴を推測することです。 例えば、新しいお菓子の味が消費者に好まれるかを調べたいとします。全員に試食してもらうのは費用と時間がかかります。そこで、一部の人たちに試食してもらい、その結果から全体の人たちが好むかどうかを推測します。この場合、試食してもらった人たちが標本、全体の人たちが母集団となります。標本から得られた「おいしい」と答えた人の割合を使って、母集団全体で「おいしい」と思う人の割合を推測します。これが推測統計学の考え方です。 推測統計学では、平均や分散といった値を使って母集団の特徴を推測します。標本から計算した平均や分散は、母集団の平均や分散と完全に一致するとは限りません。しかし、統計学的な手法を用いることで、ある程度の確からしさを持って推測することができます。例えば、「95%の確信を持って、母集団の平均は○○から○○の間にある」といった形で推定を行います。つまり、100回同じ調査をしたら95回はその範囲に真の値が含まれている、という意味です。推測統計学は、限られた情報から全体像を把握するための強力な道具であり、市場調査や品質管理など、様々な分野で活用されています。
分析

データ分析の基礎:検定とは

検定とは、統計学で使われる手法で、ある仮説が実際に集めたデータと矛盾していないかを確かめるものです。簡単に言うと、今持っているデータから、最初に立てた仮説が正しいと言えるかどうかを判断する手続きです。 例として、ある工場で作られる商品の重さの平均が100グラムだと仮定してみましょう。実際に作られた商品の重さを測り、その結果をもとに、最初の仮説(平均が100グラム)が正しいか間違っているかを調べます。この調べ方は、確率という考え方に基づいて行います。もし仮説が正しいとした場合に、実際に観測されたデータが起こる確率がどれくらい低いかを計算します。もし、観測されたデータが仮説の下ではとても起こりにくい、つまり確率が非常に低いと判断された場合、最初の仮説は間違っているとして棄却(ききゃく)します。そうでない場合は、仮説は棄却されません。 例えば、100グラムと仮定した商品の重さを100個測った結果、平均が105グラムだったとします。もし、本当に平均が100グラムであれば、100個測って平均が105グラムになることは滅多に起こらないかもしれません。このような場合、最初の仮説(100グラム)は疑わしく、棄却される可能性が高くなります。逆に、平均が100.5グラムだった場合は、100グラムという仮説とそれほど矛盾していないかもしれません。この場合、仮説は棄却されない可能性が高くなります。 検定で重要なのは、仮説が絶対に正しいか間違っているかを完全に決めるのではなく、データに基づいて確率的に判断するということです。仮説が棄却されなかったとしても、それは仮説が完全に正しいことを証明するのではなく、データと矛盾しないことを示しているに過ぎません。また、仮説が棄却された場合でも、それは仮説が完全に間違っていることを意味するのではなく、データと矛盾する可能性が高いことを示しているだけです。