以前当ブログの記事で紹介した、二つの変数の関係の強さを表す相関係数。
この相関係数を扱う上で、誤用されることも多々あるので、今回は相関係数を扱う際の留意点について学んでいく。
相関関係と因果関係を混同してはならない
例えば、インターネットの利用時間と英検試験の成績に正の相関があったとする。
単純にこの相関関係を見て、英語の習得にはインターネットの利用が不可欠だと言う人もいるかもしれないが、これは早計だ。
なぜなら、インターネットを利用しているから英検の成績が良いのか、英検の成績が良いからインターネットを抵抗なく利用できているのかは分からないからだ。
相関関係はあくまで二つの変数に何らかの関係があることを表すもので、二つの変数が原因と結果で結び付く因果関係とは全くの別物であることを意識しなくてはならない。
疑似相関に注意する
また、インターネットの利用時間と英検試験の成績の相関関係とは別に、本当は別の変数との強い相関関係により、結果として表面的に二つの変数に相関関係があるように見えているだけかもしれない。
例えば、英検試験は学年の区別なしに実施されるので、単に年齢が高いから成績が良いだけなのかもしれない。
または、年齢が高いからインターネットの利用時間が多いという可能性も考えられる。
このように、全く別の年齢という変数と真の相関関係があるにも関わらず、表面的に相関関係が見えることを疑似相関という。
まとめ
相関関係をもとに物事を判断する場合、ここで紹介した二つの留意点をおさえた上で分析をおこなわなければならない。