だが残念ながら実際には、用いられているデータが相関関係を示しているだけで、因果関係まで証明できていないことに気付かない人がかなりいる。もっと言うと、データには相関係数を示しただけのものと、因果関係まで突き止めているものの2種類あることすら知らない人も多くいる。要はデータサイエンスのリテラシーがない人がいるのだ。
有名な貧富と学力の関連を調べた研究
この相関関係と因果関係の取り違いが起きた例として有名な研究がある。学力格差を計る研究で、親の所得に応じて子供の学力が比例するという例のやつだ。格差批判の材料としてよく使われるが、実はこのよく聞く研究に疑問を抱いた研究者がいて、反証研究を行っている。というのも、貧困層の中にも一定数の高学力の子がどこにでも存在し、100%貧富の差が原因とするとこの子たちの説明ができなくなるからだ。
そこで改めて裕福な家の子と貧しくも高学力の子の共通点を調べたところ、お互い家の中に蔵書が多いということがわかった。つまり家に本が多いからたくさん読書をしているうちに読解力や知識が身につき、学力が高くなったというのが真実なのだ。
この研究結果で頭の悪い人は貧富の差=学力の差と解釈してしまうから、これは因果関係でありエビデンスであると誤認する。実際には貧富の差≠学力の差であり、蔵書の差=学力の差こそが因果関係でありエビデンスとして使える研究結果である。
貧富の差 = 学力の差 → ×誤り ×因果関係
---------------------------------------------------------------------------------------
貧富の差 ≠ 学力の差 → 〇正解 〇相関関係
蔵書の差 = 学力の差 → 〇正解 〇因果関係
なぜ貧富の差と誤解されたのか
そこでもう一つ疑問が生まれる。どうして貧富の差が関係していると誤解されたかだ。それは富裕層ならお金に余裕があるので、どんな親でもいくらでも本が買えるからだ。反対に貧困層は本に割くお金も多くはないので、蔵書も少なくなりがちで子供の学力に影響した。
ただし貧困層でも親が本好きだったり、子供の本だけにはお金を惜しまなかったりした場合には蔵書が増えるから、この場合にのみ子供の学力が上がったのだ。つまり、
富裕層 → お金が多い → 本が増える → 読書量が増える → 学力↑
貧困層 → お金が少ない → 本が少ない → 読書量が増えない → 学力↓
とい流れがあるのだが、ここでは例外がないのは本の数についてだけなので、因果関係を示せるのは本だけである。しかし、この流れを見ずに頭の貧富と結果の学力しか見ていないから、相関関係と因果関係を取り違えデマを拡散してしまうのだ。
この間違いを犯しやすい人
最後に問うのは、どういう人がこの間違いを犯しやすいのかだ。主だった条件を列挙していく。
①データを疑わずに、鵜呑みにする人
②論理的思考ができない人
③結論ありきで語る人
④リテラシーの低い人
⑤雰囲気だけで捉える人
ありがちではあるが、こういった人は相関関係と因果関係の違いをわかっていないから、うかつに何でも因果関係と判断してしまいやすい。そのデータだけでは他の要因も考えうるということに気付かないので、安易に結論付けて結果的に間違った決めつけをしてしまう。当然判断ミスが増えるから失敗を積み重ねてしまい、たくさん損をすることになる。
なので、鵜呑みにしないで一旦調べる癖をつけるのと、結論や自分の願望を一旦置いといて論理的に整合性がとれるのかを考えることによって、この間違いを減らせるはずだ。

0 件のコメント:
コメントを投稿