数量化 Ⅱ 類|カテゴリ説明でカテゴリ目的を判別(判別分析との関係)
カテゴリ特徴から目的カテゴリを識別します。実務ではロジスティック回帰やツリー系との比較で選択します。
まずはここだけ(やさしい導入)
- 何をする?: 名義カテゴリの説明変数で目的カテゴリ(例: 解約/継続)を判別
- いつ使う?: 属性や行動カテゴリからのスコアリング、しきい値で二値判定
- どう読む?: 水準の重み(寄与)を見て、どの属性が判別に効くかを理解
用語ミニ辞典(1 行で)
- 判別スコア: 各サンプルの“クラスっぽさ”のスコア
- 不均衡: クラス比が偏る状態。評価は PR-AUC や Recall を重視
- 交差検証: 過学習を防ぐための評価スキーム
ポイント
- 水準ごとの重み推定で判別スコアを作る
- 多クラス・不均衡クラスでは評価指標を適切に
実務ケーススタディ(離反予兆のスコアリング)
目的: アンケートのカテゴリ回答(不満要因/利用頻度/プラン)から離反予兆スコアを作る。
- 設計
- 名義カテゴリを特徴量化。基準水準を決めて重みを学習
- 学習と評価
- PR-AUC/Recall を重視し、しきい値は運用コストで最適化
- 運用
- スコア上位から優先フォロー。週次で再学習とドリフト監視
練習問題(理解を定着)
- 不均衡で Precision が低い。どう調整?
- ヒント: しきい値最適化、重み付け、再サンプリング
- 属性が多く過学習。対策は?
- ヒント: 正則化、次元削減、重要度で絞り込み
- ロジスティック回帰との違いは?
- ヒント: 目的は近い。実務では説明/拡張性・性能で比較し選択
数量化理論IIについてのご相談はこちら