本番環境でのモデルのモニタリング
本番でのモニタリングは、デプロイ後にモデルの性能を監視する運用フェーズの作業です。
データ準備の作業ではないため不正解です。
ある ML チームが、データ収集を終え、モデル学習に入る前の「データ準備」フェーズの作業計画を立てています。ライフサイクルの各フェーズと作業の対応を確認しながら、このフェーズで行う作業として適切なものを 2 つ選んでください。
データ準備フェーズの作業を 2 つ選ぶ問題。
本番環境でのモデルのモニタリング
本番でのモニタリングは、デプロイ後にモデルの性能を監視する運用フェーズの作業です。
データ準備の作業ではないため不正解です。
ユーザーへの推論結果の API 提供
推論結果の API 提供は、モデルをデプロイした後の本番運用の作業です。
データ準備の作業ではないため不正解です。
欠損値の補完や外れ値の処理などのデータクレンジング
正解。欠損値の補完や外れ値の処理などのデータクレンジングは、学習に使えるようにデータを整えるデータ準備の作業です。
予測に有効な特徴量を作る特徴量エンジニアリング
正解。特徴量エンジニアリングは、生データから予測に有効な入力変数(特徴量)を作る、データ準備に含まれる作業です。
モデルのハイパーパラメータの調整
ハイパーパラメータの調整は、モデル学習・チューニングのフェーズで行う作業です。
ML ライフサイクルの作業ではありますが、学習に入る前のデータ準備フェーズの作業ではないため不正解です。
機械学習ライフサイクルのフェーズと、各フェーズで行う作業を押さえます。
・データ収集: 学習に使うデータを集める。
・データ準備: クレンジング(欠損値補完・外れ値処理・形式統一)と特徴量エンジニアリング(有効な入力変数を作る)でデータを整える。
・モデル学習: アルゴリズムでモデルを訓練し、ハイパーパラメータを調整する。
・評価: 精度などの指標でモデルの性能を確認する。
・デプロイ: モデルを本番環境に展開する。
・モニタリング(運用): 本番でのモデルの挙動・精度を監視し、推論結果を API で提供する。
本問の『データクレンジング・特徴量エンジニアリング』はデータ準備フェーズ。本番モニタリング・推論 API 提供はデプロイ後の運用フェーズ、ハイパーパラメータ調整はモデル学習フェーズの作業です。