教師あり学習で分類モデルを構築する
分類モデルの学習には、事前に定義したカテゴリと、各データがどのカテゴリに属するかの正解ラベルが必要です。
本問ではセグメントの基準も正解データも存在しないため、分類モデルは学習できません。グループを「予測」するのではなく「発見」する場面です。
ある小売企業のマーケティングチームが、販促メールの出し分けのために顧客のグループ分けを計画しています。数百万件の購買履歴はあるものの、顧客をどう分けるかの基準や既存のセグメント定義(正解データ)は存在せず、購買傾向だけから似た顧客のまとまりを自動的に見つけたいと考えています。この要件に最も適したアプローチはどれですか。
正解データのないグループ分けに適したアプローチを選ぶ問題。
教師あり学習で分類モデルを構築する
分類モデルの学習には、事前に定義したカテゴリと、各データがどのカテゴリに属するかの正解ラベルが必要です。
本問ではセグメントの基準も正解データも存在しないため、分類モデルは学習できません。グループを「予測」するのではなく「発見」する場面です。
教師なし学習でクラスタリングを行う
正解。クラスタリングは、正解ラベルを使わず、特徴の近さからデータのまとまりを見つける教師なし学習の代表例です。分け方の基準が未定で正解データも存在しない本問の要件に合致します。
具体例としては、購買履歴から似た顧客層を自動でグループ分けする、大量のニュース記事を話題ごとにまとめる、などが教師なし学習にあたります。
強化学習で配信方針を最適化する
強化学習は、行動とその結果に対する報酬のフィードバックループで方策を最適化する手法です。
本問の目的は静的な購買履歴から顧客のまとまりを見つけることであり、行動と報酬のループが存在しないため不正解です。
異常検知で通常と異なる顧客を抽出する
異常検知は、大多数のパターンから乖離した少数の外れ値を見つけるタスクです。
本問の目的は全顧客を複数のまとまりに分けることであり、少数の外れ値を抽出しても販促メールの出し分けには使えないため不正解です。
同じ『グループ分け』でも、定義済みカテゴリに割り当てるなら分類(教師あり・ラベル必須)、基準もラベルもない状態でまとまりを見つけるならクラスタリング(教師なし)です。本問はセグメント定義も正解データも存在しないため教師なし学習が該当します。異常検知は少数の外れ値の抽出、強化学習は報酬ループが前提で、いずれも目的が異なります。