ある金融機関が、サポート窓口に届く問い合わせメールの自動振り分けを計画しています。過去 3 年分のメールには、担当者が付与した「スパム / 非スパム」の判定結果がすべて残っており、このデータを使って新着メールを自動判定するモデルを構築します。この要件に最も適した学習手法はどれですか。

1 / 1
回答を選択してください
正解B

解説

全件ラベル付きデータでの予測に適した学習手法を選ぶ問題。

  • 1判定結果がすべて残っており全件に正解ラベル がある=半教師あり学習は不要
  • 2新着メールを自動判定入力から ラベルを予測 する分類タスク=教師あり学習
A不正解

教師なし学習

教師なし学習は、ラベルを使わずにデータの構造や集団を見つける手法(クラスタリングなど)です。

本問では担当者の判定結果という正解ラベルを全件分活用できるため、ラベルを捨てて構造発見を行う教師なし学習は要件に合いません。

B正解

教師あり学習

正解。教師あり学習は、入力と正解ラベルの組から対応関係を学習し、新しい入力のラベルを予測する手法です。本問は過去メール全件に「スパム / 非スパム」の判定結果(ラベル)が残っているため、これを教師データとした分類モデルの構築が最適です。

具体例としては、過去の住宅データ(広さ・築年数と実売価格)から新規物件の価格を予測する、手書き数字の画像と正解ラベルから 0〜9 を判定する、などが教師あり学習にあたります。

C不正解

半教師あり学習

半教師あり学習は、少量のラベル付きデータと大量のラベルなしデータを組み合わせる手法で、ラベル付与のコストが高く全件にラベルを付けられない場合に有効です。

本問は判定結果がすべて残っている(全件ラベルあり)ため、ラベル不足を補う半教師あり学習を選ぶ理由がありません。

D不正解

強化学習

強化学習は、環境との試行錯誤と報酬を通じて行動方針を最適化する手法です。

本問は蓄積済みのラベル付きデータから予測を学ぶ問題で、環境への行動と報酬のフィードバックループが存在しないため不正解です。

ポイント

ラベルの有無と量で学習手法を切り分けます。
全件にラベルあり → 教師あり学習(分類・回帰)。
一部にのみラベルあり → 半教師あり学習。
ラベルなし → 教師なし学習(クラスタリング)。
報酬で行動を最適化 → 強化学習。
『判定結果がすべて残っている』という条件が、半教師あり学習を切るポイントです。