分類
正解。分類は、入力をあらかじめ決めたカテゴリ(離散ラベル)に割り当てる教師あり学習のタスクです。「病変あり / 病変なし」のように、答えがカテゴリの場合は分類になります。
ある病院が、放射線科医が過去に診断したラベル付きのレントゲン画像を使い、新しい胸部レントゲン画像から「病変あり / 病変なし」のどちらかを判定するモデルを作ろうとしています。病変の大きさを数値で推定する案もありましたが、今回はあり / なしの判定だけが要件です。このタスクの種別はどれですか。
カテゴリを当てるタスクの種別を選ぶ問題。
分類
正解。分類は、入力をあらかじめ決めたカテゴリ(離散ラベル)に割り当てる教師あり学習のタスクです。「病変あり / 病変なし」のように、答えがカテゴリの場合は分類になります。
回帰
回帰は、連続的な数値を予測するタスクです。
本問は「あり / なし」というカテゴリを当てるため、数値を予測する回帰ではなく不正解です。
クラスタリング
クラスタリングは、ラベルのないデータを似たもの同士に分ける教師なし学習です。
本問は「あり / なし」の正解ラベルを予測する教師あり学習であり、グループ化ではないため不正解です。
次元削減
次元削減は、データの特徴量を圧縮して扱いやすくする教師なし学習の前処理です。
本問はカテゴリを当てるタスクであり、特徴量の圧縮ではないため不正解です。
代表的な 4 つの機械学習タスクの違いを押さえます。
・分類: ラベル付きデータで学習し、入力をカテゴリ(離散ラベル)に割り当てる教師あり学習(例: 病変あり/なし、犬/猫)。
・回帰: 同じ教師あり学習だが、売上や気温などの連続する数値を予測する。
・クラスタリング: ラベルを使わず、似たデータを集団に分ける教師なし学習(例: 顧客のセグメント分け)。
・次元削減: ラベルを使わず、特徴量を圧縮して扱いやすくする教師なし学習(可視化・前処理に使う)。
出力が カテゴリ → 分類、数値 → 回帰、ラベルなしの 集団分け → クラスタリング、圧縮 → 次元削減 で見分けます。