たとえば、病気の検査で「病気でない人」を「病気あり」と誤判定することが偽陽性にあたる。
なぜ起こるのかというと、p値が有意水準(例:0.05)を下回ることをもって「効果がある」と判断していたが、実際には偶然にでた場合に偽陽性となる。
統計学や機械学習、医学検査などにおいて、第1種の過誤(Type I error)とも呼ばれる。
提唱者と歴史
偽陽性という概念は、統計的仮説検定の理論の一部として古くから存在しており、特定の個人によって提唱されたものではない。
ただし、第1種の過誤(Type I error) の枠組みは、ロナルド・フィッシャー(Ronald A. Fisher)、イェジー・ネイマン(Jerzy Neyman)、エゴン・ピアソン(Egon Pearson)らによって20世紀前半に確立された仮説検定理論の中で体系化されたものである。
-
NeymanとPearsonの論文「On the Problem of the Most Efficient Tests of Statistical Hypotheses(1933)」が特に有名。
デザイン上に関わる利用方法と具体的な事例(である調)
UX設計やプロダクト開発において、偽陽性のリスクはA/Bテストやユーザー行動分析における誤判断につながる重要な問題である。
たとえば、UIボタンの色を変更した際に、1週間のクリック率上昇を「改善効果があった」と誤って判断するケースがある。
しかし、これは一時的なばらつきに過ぎず、偽陽性による判断ミスの可能性がある。
また、パーソナライズされたレコメンドシステムにおいて、「このユーザーはこの商品に興味がある」とアルゴリズムが判断するが、実際にはそうではなかった場合も偽陽性にあたる。このような誤判定はユーザー体験の劣化につながる。
この場面で使える具体的なシーンと事例
活用シーン:
- マーケティング施策の有効性検証
- 検索エンジンのスパムフィルタ設計
- 医療・健康アプリにおけるリスク通知
- アンケート結果の分析(感情分析など)
具体的事例:
健康管理アプリにおいて、心拍数の変化を「異常」と検知しユーザーに警告を表示する機能がある。
実際には一時的な運動によるもので健康上の問題はなかった場合、これは偽陽性アラートである。
このようなケースが頻発すると、ユーザーは通知を信頼しなくなり、重要な異常にも反応しなくなる(=アラート疲れ)。
偽陽性 vs 多重検定問題
ハズレをあたりを間違えること:偽陽性
何回か数多く検証すると当たる確率にたまたま当たった場合に、あたりやすいと勘違いすること:多重検定問題