過去の月次売上実績をもとに翌月の売上額を予測する
正解。過去の売上実績という正解値(ラベル)が既に揃っており、特徴量と売上額の関係を学習して連続値を予測する回帰=教師あり学習で実現できます。
ある企業の研修で、各部門から寄せられた ML 活用案を、どの学習手法で実現すべきかという観点で整理しています。次の取り組みのうち、教師あり学習として実現するのが適切なものを 2 つ選んでください。
シナリオから教師あり学習に該当する 2 つを見分ける問題。
過去の月次売上実績をもとに翌月の売上額を予測する
正解。過去の売上実績という正解値(ラベル)が既に揃っており、特徴量と売上額の関係を学習して連続値を予測する回帰=教師あり学習で実現できます。
購買傾向が似た顧客を自動的にグループへ分ける
グループの正解データが存在せず、データの傾向からまとまりを見つけるクラスタリング=教師なし学習の典型例です。
正解を「予測」するのではなく構造を「発見」するため、教師あり学習としては不正解です。
審査担当者の過去の判定結果をもとに新規申込の合否を判定する
正解。審査担当者が付けた過去の判定結果が正解ラベルになり、新規申込を合否カテゴリに割り当てる分類=教師あり学習で実現できます。
大量の特徴量をより少ない合成変数に圧縮して可視化する
特徴量の圧縮は次元削減で、ラベルを使わずデータの構造を要約する教師なし学習の手法です。
可視化や前処理が目的であり、正解の予測ではないため教師あり学習としては不正解です。
操作結果に与えるスコアを手がかりにゲームの操作方針を改善する
スコア(報酬)を手がかりに試行錯誤で方針を改善するのは強化学習です。
固定のラベル付きデータから予測を学ぶのではなく、行動と報酬のループで学ぶため、教師あり学習としては不正解です。
教師あり学習かどうかは『正解にあたるデータが既に存在し、それを予測するか』で判定します。売上予測は過去実績、合否判定は担当者の判定結果が、それぞれ正解ラベルになります(回帰と分類)。グループ分け(クラスタリング)と特徴量の圧縮(次元削減)は正解データを使わない教師なし学習、スコアを報酬として方針を改善するのは強化学習です。