少数の法則
The Law of Small Numbers

統計的データに対する信頼性を気にせず、結果を過剰に信頼してしまうという錯覚

認知心理学の認知的錯覚の一つ。認知心理学の発展により、「少ないサンプル・試行回数によって得られた統計的な結果でも、無意識のうちに結果を正しいと思い込んでしまう」という傾向が明らかになった。この傾向は、脳の2つの思考のモードのシステム1とシステム2のうち、主に直感的思考を得意とするシステム1の性質によって引き起こされる。

心理学者のAmos Tverskyエイモス・トベルスキーDaniel Kahnemanダニエル・カーネマンが1971年に提唱した。

「少数の法則」という名前は、統計学の基本定理の一つである「大数の法則」の名前をもじっている。大数の法則とは、母集団が多くなると正規分布に近づく(サンプル数が多いほど極端なデータが取りづらくなる)こと。

統計学の定理の「ポアソンの少数の法則」とは関係がないため、混同に注意が必要である。早まった一般化(Hasty generalization)とも呼ばれる。

結果から連想するストーリーを信じてしまう

人間は「調査のサンプル数が小さくても、抽出元の母集団から考えられる特徴と良く似ているからかまわない」という考えに陥りやすい。

Howard Wainerハワード・ウェイナーHarris L. Zwerlingハリス・ツワリングによる少数の法則を説明するための調査結果がある。

腎臓ガンの出現率が低い地域:
アメリカにある3141の郡で腎臓ガンの出現率を調べたところ、出現率が低い郡の大半は、中西部・南部・西部にある人口密度の低い田舎の農村部で、共和党を支持している地域だった。

上記の調査結果が出た場合の理由を説明しようとすると、他の条件よりも農村地帯という点に着目し、「田舎は大気汚染がなく水が綺麗な環境で、添加物の入っていない新鮮な食品を食べているから、ガンになる人が少ないのだろう。」といった解釈になりやすい。

一方、腎臓ガンの出現率が高い地域の特徴は以下である場合、

腎臓ガンの出現率が高い地域:
アメリカにある3141の郡で腎臓ガンの出現率を調べたところ、出現率が高い郡の大半は、中西部・南部・西部にある人口密度の低い田舎の農村部で、共和党を支持している地域だった。

結果から、「田舎は貧しい環境なので質の高い医療を受けにくく、高脂肪の食事や飲酒率や喫煙率が高いから、それがガンの原因になっているのだろう」という解釈になりやすい。

実際には、どちらの解釈も誤である可能性がある。統計データには、標本(調査の対象となる数)が少なければ少ないほど、因果関係がない偶然によって極端な値をとりやすくなるという性質があるため、単に人口が少ないことがこういった調査結果が出た原因となりうる。

統計的根拠を無視しやすい脳の働き

脳にはシステム1とシステム2という2つの思考のモードがあり、それぞれ以下の性質がある。

システム1

  • 素早く働く
  • 自動的に連想してしまう
  • 見たものの原因を探そうとする
  • 物事を疑うよりも信じようとする
  • 自分が見たものの一貫性や整合性を誇張して考えやすい
  • 一貫性のない情報は無視しやすい
  • 標本データの大きさが適切か?といった論理的・統計的な思考がほとんどできない

システム2

  • 論理的・統計的思考が可能
  • 意識しないと、システム1が作り上げたそれらしい連想を、よく確認しないまま正しいとしてしまう

システム1は断片的な情報から素早くイメージをつかむことができ、日常生活では欠かせない思考モードである。

統計結果を解釈する際は、論理的・統計的な思考が可能なシステム2で妥当性を判断する必要があるが、システム1の「想像しやすい単純な結論を疑わずに信じようとする」性質とシステム2の「システム1が作り上げたそれらしい結論をよく確認せず正しいとしてしまう傾向」によって難しくなっている。

この性質によって、自分を取り巻く世界を、調査で裏付ける以上に単純で一貫性があるものとして捉えてしまう。

ランダム性の誤解:ホットハンド

バスケットボールには、続けざまにシュートを決める「ホットハンド」という調子が良い状態があるという考えが、選手や監督・ファンに受け入れられていた。

1985年に心理学者エイモス・トベルスキー、Thomas Gilovichトーマス・ギロビッチRobert Valloneロバート・バローネが、入ったシュートと外したシュートの順番は完全にランダムであることを証明し、ホットハンドはランダム性の中に規則や秩序を見つけてしまう認知的錯覚だとしたが、この結果を聞いた関係者は信じようとしなかった。

「人生で遭遇する事象のほとんどがランダムであるという事実を受け入れにくい」という人間の性質は、株取引やビジネスの意思決定など様々な場面で影響を及ぼしている。

株取引の業界には、株価の動きはランダムであるので将来の値動きを予想することは不可能であるという「ランダムウォーク」という言葉があり、少数の法則に陥らないように気をつける考え方がある。

調査結果からインサイトを得る際に意識する

統計的な結果から解釈されたメッセージの内容に注意を奪われ、その信頼性を示す情報にはあまり注意しない錯覚に捉われやすい性質があることを、データを見る際に意識すべきである。

統計調査の標本のサンプリング数の妥当性を確認する方法として、標本誤差早見表から目標精度に達するサンプリング数を算出することができる。

標本誤差早見表: 目標とする精度に達するために必要な標本数を確認できる
引用元: NTTコム リサーチ | サンプリング

しかし、提唱者のダニエル・カーネマン自身も提唱するまでは、サンプリングの妥当性の確認をする計算方法を知っていたにも関わらず、実験の被験者の人数は直感的に決めていて確認をしていなかったというエピソードがある。

統計学を学び研究に利用している専門家も陥ってしまうため、調査結果に向き合う際は都合の良い解釈を見出していないか、データは信頼性があるものなのか、常に注意が必要である。

関連用語

参考文献

参考サイト

この記事を書いた人:イケダマリカ

千葉大学・大学院でプロダクト・サービスデザインを学び、現在はスタートアップ支援をしています。デザイナーとして調査、UX設計、UIデザインとフロントエンド実装をやっています。UXも技術も日々勉強中!趣味は片付け、インテリア小物とゲームです。