平均の罠:中央値・分布を見ないと判断が壊れる(単価/滞在/工数)
30秒で要点
「平均が上がった=成功」と言い切る前に、中央値とばらつきを見る習慣が有効です。単価・滞在時間・工数は、一部の大きな値に平均が引っ張られやすいからです。
| 見るもの | 役割 |
|---|---|
| 平均 | 全体のだいたいの中心(外れ値に弱い) |
| CVR | コンバージョン率。訪問者のうち、問い合わせなど目標行動に至った割合 |
| KPI | 重要指標。成果の良し悪しを見るために決めた数値 |
| CVR | コンバージョン率。訪問者のうち、問い合わせなど目標行動に至った割合 |
| KPI | 重要指標。成果の良し悪しを見るために決めた数値 |
| A/B | 2パターンを比較するテスト |
| 中央値 | 真ん中の人・日(ふだんの水準に近い) |
| 分布 | 山の形・裾の長さ(平均が何を代表しているか) |
ルール — 平均と中央値が大きく離れたら、分布を1回見る。
この記事でわかること
- なぜ平均だけでは判断が壊れるか(外れ値・分布の歪み)
- 中央値・分布(ヒストグラム)をどう見るか
- 単価・滞在・工数で、何を確認してから判断するか(最小検証テンプレ)
1. ありがちな誤解(現場で起きる言い回し)
- 「平均購入単価が上がった。アップセルが効いている。」
- 「平均滞在時間でA/B比較しよう。」
- 「工数は過去の平均で見積もっている。」
- 「平均CVRでファネルを評価している。」
いずれも、外れ値(極端に大きい・小さい値)や分布の歪みがあると、平均だけが動いて実態とずれる。中央値・分布(ヒストグラム)をセットで見ないと、判断が壊れる。
2. 何が間違いか(直感と数式のズレ)
平均は外れ値に引っ張られる
平均(相加平均)は、極端に大きい値・小さい値が少数あるだけで、大きく動きます。
具体例(数字で考える):「平均滞在時間 3 分」でも、内訳が「100人のうち90人は10秒で離脱、10人は30分滞在」だと、実態は「多くのユーザーはすぐ離脱している」のに、平均だけ見ると「3分滞在」と解釈してしまう。中央値(真ん中の値)は10秒付近になり、平均と中央値が大きく離れていることが「分布の歪み」のサインです。平均を報告するときに中央値も1行書く習慣があると、この罠に気づきやすくなります。
分布の形が違うと平均の意味が変わる
- 左右対称に近い分布:平均と中央値が近く、平均の解釈がしやすい。
- 右に裾が長い分布(単価・滞在時間・工数でよくある):少数の高単価・長時間が平均を引き上げる。中央値の方が「典型的な値」に近い。
- 二峰性(2つの山がある):平均は「どちらの山でもない」中途半端な値になり、実態を代表しない。
判断基準を「平均だけ」にすると施策を誤評価する
「平均単価が上がった=成功」とすると、実際には高単価の少数顧客が増えただけで、多数の顧客の単価は下がっている、といった逆転を見逃す。セグメントや分布を見ないと、施策の効果を誤解する。
3. 何をすれば良いか(判断基準・必要データ・見方)
平均とセットで見るもの
- 中央値(メディアン):データを小さい順に並べたとき、真ん中にくる値。外れ値の影響を受けにくく、「典型的な値」の目安になる。
- 分布(ヒストグラム):値のばらつき・山の数・裾の長さを視覚で確認する。平均が「どのあたり」を代表しているかが分かる。
- 件数(n):平均だけ見ると、n が少ないときの偶然のばらつきに気づかない。n が少ない指標は解釈を控えめにする。
単価・滞在・工数でやること
- 単価:平均単価と中央値単価を並べて見る。平均が中央値より大きく離れていれば、高単価の少数が平均を引き上げている。セグメント(新規/リピート・商品カテゴリ)で分けて見る。
- 滞在時間:平均滞在時間と中央値・ヒストグラムをセットで見る。直帰に近いユーザーが多数いれば、中央値は平均より低くなる。
- 工数:過去案件の平均工数だけで見積もらない。分布を見て、「典型的な案件」の中央値と、「外れ案件」の有無を確認する。見積もりは中央値+バッファか、分布の範囲で考える。
避けること
- 平均だけをKPIにしない:少なくとも「平均と中央値」を並べ、差が大きければ分布を確認する。
- 「平均が上がった=施策が効いた」と短絡しない:セグメント・期間・母集団の変化(新規が増えた等)がないか確認する。相関と因果の区別も意識する。
4. 最小検証テンプレ(誰でも再現できる)
1つだけやるなら:平均を報告するときに 「中央値も1行書く」。平均と中央値が大きく違えば、「分布を確認した方がよい」と分かる。
もう1つやるなら:ヒストグラムを1回でよいので見る。単価・滞在・工数のうち、判断に使っている指標について、分布の形(山が1つか・裾が長いか)を確認する。
テンプレ例(判断ログ用)
- 指標:[ 例:平均購入単価 ]
- 平均:[ ]
- 中央値:[ ]
- 平均と中央値の差(解釈):[ 近い / 離れている→分布要確認 ]
- 判断:[ 平均のみで判断する / 中央値・分布を踏まえて判断する ]
判断の土台として押さえておくこと
- 平均だけでは判断しない:単価・滞在・工数は右に裾が長い分布になりやすい。平均と中央値を並べて見し、大きく違うときはヒストグラムで分布を確認する。
- 「平均が上がった=施策が効いた」と短絡しない:セグメント・期間・母集団の変化がないか確認し、分布をセットで見る。