異なる時点の数値を単純に比較し、季節性・トレンド・外的ショック・計測方法の変更・母集団の入れ替わりなどを統制せずに因果関係を結論づけてしまう推論上の誤りである。
典型例は「リリース前後の2点比較だけで“施策の効果があった”と断言する」ことである。
典型パターン(誤りの型)
- 季節性無視:週末・月末・繁忙期などの周期的変動を考慮せず前週比や前年同月比を混同する。
- トレンド混入:長期上昇(または下降)トレンドを施策効果と取り違える。
- 外的ショック混入:ニュース、競合施策、障害、広告投下など同時期の外乱を無視する。
- 計測変更の混入:定義変更(例:アクティブ定義、BOT除外ルール)が数値の段差を作っているのに施策効果と誤認する。
- コホートの入れ替わり:ユーザー構成が変化した(新規比率、地域ミックス)ことを無視して平均だけ比較する。
関連概念との関係
- (前後即)因果の誤謬に実務的な時系列の落とし穴を加えたものである。
- 回帰の誤謬(極端値の平均回帰)と組み合わさると、たまたま悪い週の後に上向いた自然回復を「施策成功」と誤読しやすい。
- シンプソンのパラドックス(集計と細分類で傾向が逆転)にも通じ、全体平均だけの前後比較は危険である。
提唱者
特定の単一提唱者は存在しない。実験計画法・準実験デザイン・時系列因果推論の文脈で前後比較のみの因果主張に注意することが古くから指摘されてきた概念である。
デザインにおける利用方法(実務での防止策)
- 対照群を設ける:A/Bテスト、地域分割、ホールドアウト群で同時比較を行う。
- 差の差(DiD):施策群と対照群の「前後差の差」を推定する。
- 中断時系列(ITS):十分な過去データから反実仮想(ベースライン)を予測し、介入点の逸脱を検定する。
- 季節調整・移動平均:曜日・月・季節ダミーなどで季節性を除去する。
- コホート分析:新規/既存、獲得チャネル、地域などを分けて時系列を比較する。
- 定義変更ログ:メトリクス定義や計測ツール更新の変更点を時系列上に記録する。
- 可視化の原則:前後2点の棒グラフではなく、介入線を引いた十分な期間の折れ線を基本とする。
具体例(数値入り)
- 季節性無視の例
ECのコンバージョン率が「機能導入前の平日:2.0%」「導入後の週末:2.6%」で+0.6pt上昇したと主張した。しかし過去12週の季節パターンを見ると週末は+0.5〜+0.7pt高いのが常であり、施策効果は未確定である。 - トレンド混入の例
アプリDAUが3か月で10万→12万に増えたため新デザイン成功とされた。しかし広告投下量は同期間で+30%であり、非広告推定DAUは横ばいであった。上昇トレンドの原因は広告である可能性が高い。 - 定義変更混入の例
NPSが月次で+8上昇。調査票を見ると同月から「中立を選びやすい設問順」へ変更されていた。計測方法の差であり、プロダクト改善の効果とは切り分けるべきである。
「この場面に使える」具体的シーン
- リリース評価:新UI公開後のITS+対照群で、季節性・外乱要因を調整した純効果を推定する。
- コンテンツ編成:キャンペーン前後のクリック率を曜日ダミーで回帰推定し、曜日効果を差し引いた上で意思決定する。
- 組織OKRレビュー:目標達成の判定に、ベースライン予測とのギャップを標準化して比較し、単純な前月比を避ける。
- CS改善:問い合わせ件数の増減を利用者母数で正規化し、プロダクトの利用規模変化を統制したうえで原因分析する。
クイック・チェックリスト
- 比較は2点のみになっていないか。
- 対照群/ホールドアウトはあるか。
- 曜日・季節・月末を調整したか。
- 広告・価格・競合・障害の外乱は記録されているか。
- 定義・ツール変更のタイムラインは重なっていないか。
- コホート別に見ても傾向は同じか。