ある ML チームが、データ収集を終え、モデル学習に入る前の「データ準備」フェーズの作業計画を立てています。ライフサイクルの各フェーズと作業の対応を確認しながら、このフェーズで行う作業として適切なものを 2 つ選んでください。

1 / 1
複数選択してください
正解C, D

解説

データ準備フェーズの作業を 2 つ選ぶ問題。

  • 1「データ準備」フェーズ学習に入る前に データを使える状態へ整える 段階
  • 2適切なものを 2 つクレンジング・特徴量エンジニアリング が該当
A不正解

本番環境でのモデルのモニタリング

本番でのモニタリングは、デプロイ後にモデルの性能を監視する運用フェーズの作業です。

データ準備の作業ではないため不正解です。

B不正解

ユーザーへの推論結果の API 提供

推論結果の API 提供は、モデルをデプロイした後の本番運用の作業です。

データ準備の作業ではないため不正解です。

C正解

欠損値の補完や外れ値の処理などのデータクレンジング

正解。欠損値の補完や外れ値の処理などのデータクレンジングは、学習に使えるようにデータを整えるデータ準備の作業です。

D正解

予測に有効な特徴量を作る特徴量エンジニアリング

正解。特徴量エンジニアリングは、生データから予測に有効な入力変数(特徴量)を作る、データ準備に含まれる作業です。

E不正解

モデルのハイパーパラメータの調整

ハイパーパラメータの調整は、モデル学習・チューニングのフェーズで行う作業です。

ML ライフサイクルの作業ではありますが、学習に入る前のデータ準備フェーズの作業ではないため不正解です。

ポイント

機械学習ライフサイクルのフェーズと、各フェーズで行う作業を押さえます。
データ収集: 学習に使うデータを集める。
データ準備: クレンジング(欠損値補完・外れ値処理・形式統一)と特徴量エンジニアリング(有効な入力変数を作る)でデータを整える。
モデル学習: アルゴリズムでモデルを訓練し、ハイパーパラメータを調整する。
評価: 精度などの指標でモデルの性能を確認する。
デプロイ: モデルを本番環境に展開する。
モニタリング(運用): 本番でのモデルの挙動・精度を監視し、推論結果を API で提供する。
本問の『データクレンジング・特徴量エンジニアリング』はデータ準備フェーズ。本番モニタリング・推論 API 提供はデプロイ後の運用フェーズ、ハイパーパラメータ調整はモデル学習フェーズの作業です。