変数

記事数:(4)

分析

相関係数:関係性を紐解く鍵

相関係数とは、二つのものの関係の強さを数字で表す方法です。この数字は、-1から1までの範囲で表されます。たとえば、身長と体重を考えてみましょう。一般的に、身長が高い人ほど体重も重い傾向があります。このような関係を「正の相関」と呼びます。身長と体重の相関係数は、1に近い正の値になります。相関係数が1に近いほど、二つのものの関係はより強いことを示します。つまり、身長が高いと体重もほぼ確実に重いという関係が強いことを意味します。 逆に、商品の値段と売れる個数を考えてみましょう。値段が高いほど、売れる個数は少なくなる傾向があります。このような関係を「負の相関」と呼びます。値段と売れる個数の相関係数は、-1に近い負の値になります。相関係数が-1に近いほど、二つのものの関係はより強いことを示します。つまり、値段が高いと売れる個数がほぼ確実に少ないという関係が強いことを意味します。 では、相関係数が0に近い場合はどうなるでしょうか?これは、二つのものの間に関係がほとんどないことを意味します。たとえば、サイコロを振った時の目と明日の気温には、関係がないと考えられます。このような場合、相関係数は0に近い値になります。0に近いほど、二つのものは無関係に近く、一方の値からもう一方の値を予測することはできません。 このように、相関係数は二つのものの関係の強さと方向を理解するのに便利な道具です。正の相関、負の相関、そして無相関を理解することで、身の回りの様々な現象をより深く理解することができます。
機械学習

説明変数とは?売上予測等、ビジネスへの活用例

物事の結果に影響を与える要素を説明変数と呼びます。別の言い方では独立変数とも呼ばれ、原因となるものを指します。例えば、ある食堂の売り上げを予想したいとします。売り上げに影響を与えるものとして、天気や気温、空気中の水分量などが考えられます。これらの天気、気温、空気中の水分量が説明変数となります。 そもそも変数とは、観測対象によって値が変わるもののことです。天気は晴れや雨、曇りと変化し、気温や空気中の水分量も日々変わります。このように変わる値を持つものを変数として扱います。 数式で説明変数を理解してみましょう。例えば、中学校で習う一次関数「結果 = 係数 × 原因」を考えてみます。「結果」を目的変数、「係数」を傾き、「原因」を説明変数と呼び替えることができます。具体例として、食堂の売り上げを予測する式を考えてみます。「売り上げ = 係数 × 気温」という式を作ったとします。気温が高いほど売り上げも増えるという仮説を立て、係数を3と決めます。気温が30度の日は「売り上げ = 3 × 30」で計算され、売り上げは90と予測されます。このように説明変数である気温の変化によって、売り上げという結果が変わる様子を表すことができます。 説明変数は、予測したい目的変数に影響を与えると考えられる変数です。目的変数とは、予測したい結果のことです。先ほどの例では、食堂の売り上げが目的変数です。売り上げに影響を与える要素を考え、説明変数を選びます。説明変数の種類は様々で、数値で表せるものとそうでないものがあります。数値で表せる量的データの例としては、気温や湿度、商品の値段などがあります。一方、天気や曜日、顧客の性別などは数値で表せない質的データです。質的データを説明変数として使う場合は、晴れを1、雨を2といったように数値を割り当てて分析を行います。適切な説明変数を選ぶことで、より正確な予測が可能になります。