錯誤相関
Illusory Correlation

相関がないデータに相関があると思いこんでしまうこと。

実際の相関がないデータ同士に、それらの繋がりを過大評価してしまい、相関性があると思い込んでしまう認知バイアスのひとつ。
もともとは1960年代にコンサルティングファームChapman&Chapmanチャップマン&チャップマンが実験によって発見し提唱したものである。
ステレオタイプが形成される一因ともなっている。

Chapman&Chapmanの人物画テストによる実験

実験ではまず被験者に対して、架空の精神病患者の臨床診断結果と、その患者が描いたとされる人物の絵をセットにしたデータを与えた。
次に被験者には、患者の絵の中に「奇妙な目」といった特徴が現れる頻度が、通常の人と比べて多いかどうか見積もってもらう。
実際の医学的見解では「精神病患者であること」と「人物の絵に奇妙な目を描くこと」は相関関係がないデータである。
しかし実験に参加した被験者の多くが、精神病患者は人物の絵に奇妙な目を描く頻度が通常より多いと判断した。

この実験から2つの事象が同時に起きる頻度の判断にバイアスがあることを発見した。

統計の錯誤相関

錯誤相関の例
このグラフの2本の線は似た動きをしていて、相関関係があるように見える。

実際には黒い線が「俳優ニコラス・ケイジの映画出演本数の推移」、赤い線が「アメリカで1年間にプールで溺れた人数の推移」という全く関係がないものである。

しかし重ね合わせたグラフだけから判断してしまうと、ニコラス・ケイジが映画に出演するほどプールで溺れる人が増えるという、とんでもない結論が出てしまう。

これは極端な例であるが、もしも水着の売上数や自家用プールの設置率といった関係ありそうなデータが似たグラフの動きを示していたら、どうだろうか?
実際には相関性がなくても錯誤相関は消えないため、本当の原因を突き止める際の妨げとなってしまうことがある。

記憶と錯誤相関

例えば、株の取引をおこなっている方の中には、自分が株を買った瞬間からいつも下がって損をしていると思っている方も多いのではないだろうか。
株を買った場合に実際は損をすることも儲かることもあり、「自分が株を買うという行為」と「買った銘柄の株価が上がるか下がるか」という2つのデータにはほとんど関連性がない。
それでも損をした場合の記憶が強く残ってしまい、この2つのデータが必要以上に結びついてしまうことから起こる錯誤相関である。(→ プロスペクト理論ネガティブ・バイアス

もうひとつの例として「美容室、歯科医院、コンビニの中で、日本で最も数が多いのはどれか?」という質問に対して、実際には美容室が一番多いのだがコンビニと答える人が多かった。
これも実際に自分がよく利用しているものが強く記憶に残り、「自分の周辺で目に入る店舗数」と「実際の店舗数」を錯誤相関している例である。(→ 利用可能性ヒューリスティック

定量データのみに頼る危険性

売上とPVのデータだけを見て、PVを増やせば自動的に売上も増えると思ってしまったこともあるかもしれない。
このように数値による定量データのみに固執して、それらが定性的なデータよりも優れていると判断することは、錯誤相関の可能性があるという観点からも危険である。
特にユーザーインターフェイスなどは人間の行動を深く観察することで得られるものも大きく、定性・定量両方のデータを組み合わせながら実際の関係性を判断していく必要がある。

関連用語

参考文献

参考サイト

この記事を書いた人:山田 和広

株式会社PR TIMES エンジニア。
2000年慶應義塾大学環境情報学部卒業。新卒でWEB制作会社に入社。その後、映画宣伝会社でハリウッド映画等の公式サイト作成・オンライン宣伝企画を担当。2014年4月PR TIMESへフロントエンド・エンジニアとして入社し、サービスの企画・開発を行っています。