因果関係

記事数:(3)

分析

隠れた関係:疑似相関の謎

疑似相関とは、二つの出来事が、まるで関係しているように見えて、実は直接的な繋がりがない現象のことです。この不思議な現象は、まるで魔法のトリックのように、本来は関係ないはずの二つの出来事を、あたかも深い関係があるかのように見せかけます。 例えば、夏の暑い時期には、アイスクリームがよく売れます。同時に、悲しいことに水の事故も増えてしまいます。アイスクリームの売り上げと水の事故の発生件数をグラフにすると、どちらも同じように増えていくため、一見すると、アイスクリームをたくさん食べると水の事故が増えるように思えてしまいます。しかし、少し考えてみると、アイスクリームを食べたからといって、直接的に水の事故に遭うとは考えにくいでしょう。 実は、この二つの出来事には、隠れた共通の原因があります。それは「気温」です。気温が上がると、アイスクリームの需要が増えます。また、気温が上がると、水遊びをする人も増え、結果として水の事故の危険性も高まります。つまり、アイスクリームの売り上げと水の事故の発生件数は、どちらも気温の変化という共通の原因によって影響を受けているだけで、直接的な関係はないのです。 このように、見かけ上の関係に騙されて、二つの出来事の間に因果関係があると勘違いしてしまうことを、疑似相関といいます。疑似相関は、データ分析をする際に、特に注意が必要な落とし穴です。データだけを見て安易に結論を出すのではなく、背後に隠れた真の原因を探ることが重要です。さもなければ、まるで魔法にかけられたように、間違った解釈をしてしまうかもしれません。
分析

データの関係を読み解く:相関とは

ものごとの関係性を数値で表すことを、相関と言います。2つの数値の間にある関係の強さを示す統計的な尺度であり、-1から1までの数値で表されます。この数値を相関係数と呼びます。相関係数が1に近いほど正の相関が強く、-1に近いほど負の相関が強いことを示します。0に近い場合は、2つの数値の間に関係がない、つまり無相関であることを意味します。 例えば、夏の暑い時期にアイスクリームの売り上げが伸びる現象を考えてみましょう。気温が高い日にはアイスクリームがよく売れ、気温が低い日にはあまり売れません。これは気温とアイスクリームの売り上げに正の相関があることを示す典型的な例です。気温が上がれば上がるほど、アイスクリームの売り上げも増える傾向にあるため、相関係数は1に近づきます。 反対に、気温と厚着の関係を考えてみましょう。気温が低い冬には、多くの人が厚着をしますが、気温が高くなるにつれて、厚着をする人は減っていきます。これは気温と厚着の枚数の間に負の相関があることを意味します。気温が上がれば上がるほど厚着の枚数は減る傾向にあるため、相関係数は-1に近づきます。 相関関係は、2つの数値の間に因果関係があることを必ずしも意味するものではないことに注意が必要です。例えば、アイスクリームの売り上げと水難事故の発生件数には正の相関が見られるかもしれません。これは、気温が高い日にアイスクリームの売り上げも水難事故の発生件数も増えるためです。しかし、アイスクリームをたくさん食べたから水難事故に遭うわけではありません。このように、見かけ上の相関関係に惑わされず、背後にある要因を注意深く考察することが重要です。相関を理解することで、ものごとの関係性を客観的に捉え、より深い洞察を得ることができるようになります。