正解データのないグループ分けに適したアプローチを選ぶ問題。

ある小売企業のマーケティングチームが、販促メールの出し分けのために顧客のグループ分けを計画しています。数百万件の購買履歴はあるものの、顧客をどう分けるかの基準や既存のセグメント定義（正解データ）は存在せず、購買傾向だけから似た顧客のまとまりを自動的に見つけたいと考えています。この要件に最も適したアプローチはどれですか。

1 / 1

回答を選択してください

正解B

解説

問題の概要

正解データのないグループ分けに適したアプローチを選ぶ問題。

満たすべき条件

1「セグメント定義（正解データ）は存在せず」正解ラベルがない＝教師あり学習（分類）は学習できない
2「似た顧客のまとまりを自動的に見つけたい」データの構造から 集団を発見＝クラスタリング

選択肢ごとの解説

A不正解

教師あり学習で分類モデルを構築する

分類モデルの学習には、事前に定義したカテゴリと、各データがどのカテゴリに属するかの正解ラベルが必要です。

本問ではセグメントの基準も正解データも存在しないため、分類モデルは学習できません。グループを「予測」するのではなく「発見」する場面です。

B正解

教師なし学習でクラスタリングを行う

正解。クラスタリングは、正解ラベルを使わず、特徴の近さからデータのまとまりを見つける教師なし学習の代表例です。分け方の基準が未定で正解データも存在しない本問の要件に合致します。

具体例としては、購買履歴から似た顧客層を自動でグループ分けする、大量のニュース記事を話題ごとにまとめる、などが教師なし学習にあたります。

C不正解

強化学習で配信方針を最適化する

強化学習は、行動とその結果に対する報酬のフィードバックループで方策を最適化する手法です。

本問の目的は静的な購買履歴から顧客のまとまりを見つけることであり、行動と報酬のループが存在しないため不正解です。

D不正解

異常検知で通常と異なる顧客を抽出する

異常検知は、大多数のパターンから乖離した少数の外れ値を見つけるタスクです。

本問の目的は全顧客を複数のまとまりに分けることであり、少数の外れ値を抽出しても販促メールの出し分けには使えないため不正解です。

ポイント

同じ『グループ分け』でも、定義済みカテゴリに割り当てるなら分類（教師あり・ラベル必須）、基準もラベルもない状態でまとまりを見つけるならクラスタリング（教師なし）です。本問はセグメント定義も正解データも存在しないため教師なし学習が該当します。異常検知は少数の外れ値の抽出、強化学習は報酬ループが前提で、いずれも目的が異なります。

解説

💡ポイント

関連リンク

ポイント