メインコンテンツへスキップ
ブログ一覧に戻る
統計・データサイエンス

平均の罠:中央値・分布を見ないと判断が壊れる(単価/滞在/工数)

2026年1月21日
5分で読めます
平均の罠:中央値・分布を見ないと判断が壊れる(単価/滞在/工数)

この記事の結論

「平均単価が上がった」「平均滞在時間で比較しよう」— 平均だけ見ると外れ値や分布の歪みで実態を見誤る。単価・滞在・工数で何が間違いか・何をすれば良いか・最小検証の型を整理します。

平均の罠:中央値・分布を見ないと判断が壊れる(単価/滞在/工数)

30秒で要点

「平均が上がった=成功」と言い切る前に、中央値ばらつきを見る習慣が有効です。単価・滞在時間・工数は、一部の大きな値に平均が引っ張られやすいからです。

見るもの役割
平均全体のだいたいの中心(外れ値に弱い)
CVRコンバージョン率。訪問者のうち、問い合わせなど目標行動に至った割合
KPI重要指標。成果の良し悪しを見るために決めた数値
CVRコンバージョン率。訪問者のうち、問い合わせなど目標行動に至った割合
KPI重要指標。成果の良し悪しを見るために決めた数値
A/B2パターンを比較するテスト
中央値真ん中の人・日(ふだんの水準に近い)
分布山の形・裾の長さ(平均が何を代表しているか)

ルール — 平均と中央値が大きく離れたら、分布を1回見る。

この記事でわかること

  • なぜ平均だけでは判断が壊れるか(外れ値・分布の歪み)
  • 中央値分布(ヒストグラム)をどう見るか
  • 単価・滞在・工数で、何を確認してから判断するか(最小検証テンプレ)

1. ありがちな誤解(現場で起きる言い回し)

  • 「平均購入単価が上がった。アップセルが効いている。」
  • 「平均滞在時間でA/B比較しよう。」
  • 「工数は過去の平均で見積もっている。」
  • 「平均CVRでファネルを評価している。」

いずれも、外れ値(極端に大きい・小さい値)分布の歪みがあると、平均だけが動いて実態とずれる。中央値・分布(ヒストグラム)をセットで見ないと、判断が壊れる。

2. 何が間違いか(直感と数式のズレ)

平均は外れ値に引っ張られる

平均(相加平均)は、極端に大きい値・小さい値が少数あるだけで、大きく動きます。

具体例(数字で考える):「平均滞在時間 3 分」でも、内訳が「100人のうち90人は10秒で離脱、10人は30分滞在」だと、実態は「多くのユーザーはすぐ離脱している」のに、平均だけ見ると「3分滞在」と解釈してしまう。中央値(真ん中の値)は10秒付近になり、平均と中央値が大きく離れていることが「分布の歪み」のサインです。平均を報告するときに中央値も1行書く習慣があると、この罠に気づきやすくなります。

分布の形が違うと平均の意味が変わる

  • 左右対称に近い分布:平均と中央値が近く、平均の解釈がしやすい。
  • 右に裾が長い分布(単価・滞在時間・工数でよくある):少数の高単価・長時間が平均を引き上げる。中央値の方が「典型的な値」に近い。
  • 二峰性(2つの山がある):平均は「どちらの山でもない」中途半端な値になり、実態を代表しない。

判断基準を「平均だけ」にすると施策を誤評価する

「平均単価が上がった=成功」とすると、実際には高単価の少数顧客が増えただけで、多数の顧客の単価は下がっている、といった逆転を見逃す。セグメントや分布を見ないと、施策の効果を誤解する。

3. 何をすれば良いか(判断基準・必要データ・見方)

平均とセットで見るもの

  • 中央値(メディアン):データを小さい順に並べたとき、真ん中にくる値。外れ値の影響を受けにくく、「典型的な値」の目安になる。
  • 分布(ヒストグラム):値のばらつき・山の数・裾の長さを視覚で確認する。平均が「どのあたり」を代表しているかが分かる。
  • 件数(n):平均だけ見ると、n が少ないときの偶然のばらつきに気づかない。n が少ない指標は解釈を控えめにする。

単価・滞在・工数でやること

  • 単価:平均単価と中央値単価を並べて見る。平均が中央値より大きく離れていれば、高単価の少数が平均を引き上げている。セグメント(新規/リピート・商品カテゴリ)で分けて見る。
  • 滞在時間:平均滞在時間と中央値・ヒストグラムをセットで見る。直帰に近いユーザーが多数いれば、中央値は平均より低くなる。
  • 工数:過去案件の平均工数だけで見積もらない。分布を見て、「典型的な案件」の中央値と、「外れ案件」の有無を確認する。見積もりは中央値+バッファか、分布の範囲で考える。

避けること

  • 平均だけをKPIにしない:少なくとも「平均と中央値」を並べ、差が大きければ分布を確認する。
  • 「平均が上がった=施策が効いた」と短絡しない:セグメント・期間・母集団の変化(新規が増えた等)がないか確認する。相関と因果の区別も意識する。

4. 最小検証テンプレ(誰でも再現できる)

1つだけやるなら:平均を報告するときに 「中央値も1行書く」。平均と中央値が大きく違えば、「分布を確認した方がよい」と分かる。

もう1つやるならヒストグラムを1回でよいので見る。単価・滞在・工数のうち、判断に使っている指標について、分布の形(山が1つか・裾が長いか)を確認する。

テンプレ例(判断ログ用)

  • 指標:[ 例:平均購入単価 ]
  • 平均:[ ]
  • 中央値:[ ]
  • 平均と中央値の差(解釈):[ 近い / 離れている→分布要確認 ]
  • 判断:[ 平均のみで判断する / 中央値・分布を踏まえて判断する ]

判断の土台として押さえておくこと

  • 平均だけでは判断しない:単価・滞在・工数は右に裾が長い分布になりやすい。平均と中央値を並べて見し、大きく違うときはヒストグラムで分布を確認する。
  • 「平均が上がった=施策が効いた」と短絡しない:セグメント・期間・母集団の変化がないか確認し、分布をセットで見る。