複数の集団をまとめて解析すると、一見すると明確に見える傾向や関係性が、集団を細かく分けて分析すると逆転する、という統計的な現象である。これは「潜在変数(隠れた要因)」が結果に影響を与えるために起こる。
たとえば大学の入試で「全体では男女で合格率に差があるように見えるが、学部別に分けると逆の傾向が現れる」というようなケースである。
以下の表では、A校の方が全体の平均点が高いが、文系、理系で分けたときはB校の方が両方の平均点が高い。
提唱者について
1951年にイギリスの統計学者 エドワード・H・シンプソン(Edward H. Simpson) によって記述されたものである。ただし、その前から関連する事例は知られていた。
デザイン上の利用方法と具体的事例
-
利用方法
デザインやUXリサーチにおいて、利用者行動の統計を解釈する際に、シンプソンのパラドックスを理解することは誤解を避けるために重要である。ユーザーを「全体」で見ると効果がありそうに見えても、属性ごとに分けると逆の結果が現れる場合がある。 -
具体例
A/Bテストで新しいデザインを導入したところ、全体では「新デザインの方がクリック率が低い」ように見えた。しかし年齢層ごとに分析すると、若年層には効果が高く、高齢層では効果が低いことがわかる。この場合、全体平均を見ただけでは誤った判断を下すリスクがある。
プロダクトやコンテンツデザインの観点で使える場面と具体例
ユーザー調査・アクセス解析・マーケティングデータ分析など、「集団全体」と「セグメント別」の結果が異なる可能性がある場面。
-
具体例
ECサイトで「全体ではスマホ利用者の購入率が低い」と見えたとしても、カテゴリごとに分けると「ファッションでは高いが、家電では低い」という逆転が起きることがある。この場合、デザイン改善や施策を「スマホ全体」で変えるのではなく、カテゴリごとの体験設計が必要である。
まとめ
シンプソンのパラドックス
-
意味
複数の集団をまとめて分析すると一方向の傾向が出るが、集団ごとに分けて分析するとその傾向が逆転するという統計的な現象である。 -
例
病院の治療成績で「全体では病院Aの成功率が低い」と見えるが、重症患者と軽症患者に分けると、どちらも病院Aの方が高い成功率になる。 -
ポイント
「人間の誤解」ではなく、データの集計構造そのものが逆転を生み出す数学的現象。
項目 | 集団間比較の誤謬 | シンプソンのパラドックス |
---|---|---|
本質 | 誤った比較によるバイアス | 集計方法によって結果が逆転する統計的現象 |
性質 | 思考の偏り(ヒューマンエラー) | 数学的に起こりうる逆転現象 |
原因 | 背景条件を無視して比較すること | 潜在変数(隠れた要因)が逆転を引き起こす |
例 | 大学・会社・国などの平均比較 | 医療成績やA/Bテストの結果逆転 |
防止策 | 集団の条件を揃えて比較 | セグメント分析を必ず実施 |