データ準備フェーズの作業を 2 つ選ぶ問題。

ある ML チームが、データ収集を終え、モデル学習に入る前の「データ準備」フェーズの作業計画を立てています。ライフサイクルの各フェーズと作業の対応を確認しながら、このフェーズで行う作業として適切なものを 2 つ選んでください。

1 / 1

複数選択してください

正解C, D

解説

問題の概要

データ準備フェーズの作業を 2 つ選ぶ問題。

満たすべき条件

1「「データ準備」フェーズ」学習に入る前に データを使える状態へ整える 段階
2「適切なものを 2 つ」クレンジング・特徴量エンジニアリング が該当

選択肢ごとの解説

A不正解

本番環境でのモデルのモニタリング

本番でのモニタリングは、デプロイ後にモデルの性能を監視する運用フェーズの作業です。

データ準備の作業ではないため不正解です。

B不正解

ユーザーへの推論結果の API 提供

推論結果の API 提供は、モデルをデプロイした後の本番運用の作業です。

データ準備の作業ではないため不正解です。

C正解

欠損値の補完や外れ値の処理などのデータクレンジング

正解。欠損値の補完や外れ値の処理などのデータクレンジングは、学習に使えるようにデータを整えるデータ準備の作業です。

D正解

予測に有効な特徴量を作る特徴量エンジニアリング

正解。特徴量エンジニアリングは、生データから予測に有効な入力変数（特徴量）を作る、データ準備に含まれる作業です。

E不正解

モデルのハイパーパラメータの調整

ハイパーパラメータの調整は、モデル学習・チューニングのフェーズで行う作業です。

ML ライフサイクルの作業ではありますが、学習に入る前のデータ準備フェーズの作業ではないため不正解です。

ポイント

機械学習ライフサイクルのフェーズと、各フェーズで行う作業を押さえます。
・データ収集: 学習に使うデータを集める。
・データ準備: クレンジング（欠損値補完・外れ値処理・形式統一）と特徴量エンジニアリング（有効な入力変数を作る）でデータを整える。
・モデル学習: アルゴリズムでモデルを訓練し、ハイパーパラメータを調整する。
・評価: 精度などの指標でモデルの性能を確認する。
・デプロイ: モデルを本番環境に展開する。
・モニタリング（運用）: 本番でのモデルの挙動・精度を監視し、推論結果を API で提供する。
本問の『データクレンジング・特徴量エンジニアリング』はデータ準備フェーズ。本番モニタリング・推論 API 提供はデプロイ後の運用フェーズ、ハイパーパラメータ調整はモデル学習フェーズの作業です。

解説

💡ポイント

関連リンク

ポイント