import { NavigationBlock } from "@/components/blog/NavigationBlock";
平均の罠:中央値・分布を見ないと判断が壊れる(単価/滞在/工数)
ありがちな言い回し:「平均単価が上がった。施策は成功だ。」「平均滞在時間で比較しよう。」「工数は平均で見積もっている。」
現場では、平均値だけで判断し、外れ値や分布の歪みで実態を見誤ることがあります。単価・滞在時間・工数などは、平均とあわせて中央値・分布を見ないと、判断が壊れやすいです。
この記事の仮説:「平均だけ」を判断基準にしない習慣があると、施策評価・見積もり・KPIの解釈が壊れにくくなる。
この記事が想定する読者:単価・滞在時間・工数などで「平均」だけで判断しがちな方。中央値や分布をどう見ればよいか型にしたい担当者。
判断を誤るとどうなるか:平均だけ見ると外れ値や分布の歪みで実態を見誤り、施策評価・見積もりが壊れる。平均と中央値を並べて見し、平均と中央値が大きく違うときはヒストグラムで分布を確認すると壊れにくくなります。
この記事でわかること
- なぜ平均だけでは判断が壊れるか(外れ値・分布の歪み)
- 中央値・分布(ヒストグラム)をどう見るか
- 単価・滞在・工数で、何を確認してから判断するか(最小検証テンプレ)
1. ありがちな誤解(現場で起きる言い回し)
- 「平均購入単価が上がった。アップセルが効いている。」
- 「平均滞在時間でA/B比較しよう。」
- 「工数は過去の平均で見積もっている。」
- 「平均CVRでファネルを評価している。」
いずれも、外れ値(極端に大きい・小さい値)や分布の歪みがあると、平均だけが動いて実態とずれる。中央値・分布(ヒストグラム)をセットで見ないと、判断が壊れる。
2. 何が間違いか(直感と数式のズレ)
平均は外れ値に引っ張られる
平均(相加平均)は、極端に大きい値・小さい値が少数あるだけで、大きく動きます。
具体例(数字で考える):「平均滞在時間 3 分」でも、内訳が「100人のうち90人は10秒で離脱、10人は30分滞在」だと、実態は「多くのユーザーはすぐ離脱している」のに、平均だけ見ると「3分滞在」と解釈してしまう。中央値(真ん中の値)は10秒付近になり、平均と中央値が大きく離れていることが「分布の歪み」のサインです。平均を報告するときに中央値も1行書く習慣があると、この罠に気づきやすくなります。
分布の形が違うと平均の意味が変わる
- 左右対称に近い分布:平均と中央値が近く、平均の解釈がしやすい。
- 右に裾が長い分布(単価・滞在時間・工数でよくある):少数の高単価・長時間が平均を引き上げる。中央値の方が「典型的な値」に近い。
- 二峰性(2つの山がある):平均は「どちらの山でもない」中途半端な値になり、実態を代表しない。
判断基準を「平均だけ」にすると施策を誤評価する
「平均単価が上がった=成功」とすると、実際には高単価の少数顧客が増えただけで、多数の顧客の単価は下がっている、といった逆転を見逃す。セグメントや分布を見ないと、施策の効果を誤解する。
3. 何をすれば良いか(判断基準・必要データ・見方)
平均とセットで見るもの
- 中央値(メディアン):データを小さい順に並べたとき、真ん中にくる値。外れ値の影響を受けにくく、「典型的な値」の目安になる。
- 分布(ヒストグラム):値のばらつき・山の数・裾の長さを視覚で確認する。平均が「どのあたり」を代表しているかが分かる。
- 件数(n):平均だけ見ると、n が少ないときの偶然のばらつきに気づかない。n が少ない指標は解釈を控えめにする。
単価・滞在・工数でやること
- 単価:平均単価と中央値単価を並べて見る。平均が中央値より大きく離れていれば、高単価の少数が平均を引き上げている。セグメント(新規/リピート・商品カテゴリ)で分けて見る。
- 滞在時間:平均滞在時間と中央値・ヒストグラムをセットで見る。直帰に近いユーザーが多数いれば、中央値は平均より低くなる。
- 工数:過去案件の平均工数だけで見積もらない。分布を見て、「典型的な案件」の中央値と、「外れ案件」の有無を確認する。見積もりは中央値+バッファか、分布の範囲で考える。
避けること
- 平均だけをKPIにしない:少なくとも「平均と中央値」を並べ、差が大きければ分布を確認する。
- 「平均が上がった=施策が効いた」と短絡しない:セグメント・期間・母集団の変化(新規が増えた等)がないか確認する。相関と因果の区別も意識する。
4. 最小検証テンプレ(誰でも再現できる)
1つだけやるなら:平均を報告するときに 「中央値も1行書く」。平均と中央値が大きく違えば、「分布を確認した方がよい」と分かる。
もう1つやるなら:ヒストグラムを1回でよいので見る。単価・滞在・工数のうち、判断に使っている指標について、分布の形(山が1つか・裾が長いか)を確認する。
テンプレ例(判断ログ用)
- 指標:[ 例:平均購入単価 ]
- 平均:[ ]
- 中央値:[ ]
- 平均と中央値の差(解釈):[ 近い / 離れている→分布要確認 ]
- 判断:[ 平均のみで判断する / 中央値・分布を踏まえて判断する ]
よくある質問(FAQ)
平均と中央値の違いは、一言でいうと何ですか?
平均は全データの合計を件数で割った値で、外れ値(極端に大きい・小さい値)に引っ張られます。中央値はデータを小さい順に並べたときの真ん中の値で、外れ値の影響を受けにくく「典型的な値」の目安になります。平均と中央値が大きく離れていれば、分布の歪みがあるサインです。
平均だけ見ていいケースはありますか?
左右対称に近い分布では平均と中央値が近く、平均の解釈がしやすいです。ただし単価・滞在時間・工数は右に裾が長い分布になりやすいため、平均だけでは実態を見誤りがちです。少なくとも「平均と中央値」を並べて見る習慣を推奨します。
ヒストグラムはいつ見ればよいですか?
平均と中央値が大きく違うときは、分布の形(山が1つか・裾が長いか・二峰性か)を確認するためにヒストグラムを1回でよいので見ることを推奨します。単価・滞在・工数のうち、判断に使っている指標について分布の形を確認すると、平均が「どのあたり」を代表しているかが分かります。
「平均が上がった=施策が効いた」と判断してよいですか?
セグメント・期間・母集団の変化(新規が増えた等)がないか確認することを推奨します。平均が上がっても、高単価の少数顧客が増えただけで、多数の顧客の単価は下がっている、といった逆転があり得ます。相関と因果の区別も意識し、施策の効果を言うときはセグメントや分布をセットで見ると安全です。
本記事は平均の罠と判断(中央値・分布・セグメントの見方)に特化しています。実際にどの指標を確認すべきかは目的・データにより異なるため、統計で判断を壊さない・相関と因果・サンプルサイズの罠とあわせて自社の前提に合わせた判断をおすすめします。
判断の土台として押さえておくこと
- 平均だけでは判断しない:単価・滞在・工数は右に裾が長い分布になりやすい。平均と中央値を並べて見し、大きく違うときはヒストグラムで分布を確認する。
- 「平均が上がった=施策が効いた」と短絡しない:セグメント・期間・母集団の変化がないか確認し、分布をセットで見る。
- 次の一手:現場で壊れる統計ミス一覧は統計で判断を壊さない(検証の型)、相関と因果は相関と因果:マーケ施策で事故る典型例、サンプルサイズはサンプルサイズ・A/Bテストの罠を参照する。
関連記事
- Web担当者のための統計学入門(平均値の罠) — 基本指標と平均値の罠の概要
- 統計で判断を壊さない(検証の型) — 現場で壊れる統計ミス一覧
- 相関と因果:マーケ施策で事故る典型例 — 平均だけでなく交絡も確認
- GA4アトリビューション入門 — 成果の帰属と数字の見方
- CROの進め方|何から検証するべきか
次に読む・最小検証
計測・判断の設計に関するご相談はこちらrelatedHub={{ title: "統計で判断を壊さない(検証の型)|現場で起きる統計ミスと対処法", url: "/blog/data/statistics-judgment-hub" }} nextInCategory={[ { title: "ベースレート無視:CVR改善で「母数」を忘れると詰む", url: "/blog/data/base-rate-neglect-cvr-pitfalls" }, { title: "データドリブン意思決定:ビジネスと統計学の融合", url: "/blog/data/data-driven-decision-making" }, { title: "シンプソンのパラドックス:セグメントで分けると結論が逆転する", url: "/blog/data/simpson-paradox-segment-reversal" }, { title: "統計で判断を壊さない(検証の型)|現場で起きる統計ミスと対処法", url: "/blog/data/statistics-judgment-hub" }, ]} philosophyLink={true} />