ある企業が初めての ML プロジェクトを開始するにあたり、ML 開発ライフサイクルの一般的な進め方を整理しています。データ収集から運用までのフェーズの順序として、最も適切なものはどれですか。

1 / 1
回答を選択してください
正解B

解説

ML 開発ライフサイクルの順序を選ぶ問題。

  • 1ML 開発ライフサイクルデータ収集 → 前処理 → 学習 → 評価 → デプロイ → 監視の流れ
  • 2フェーズの順序前処理は学習の前、評価はデプロイの前 が要点
A不正解

データ収集 → モデル学習 → 前処理 → 評価 → デプロイ → モニタリング

前処理がモデル学習のに置かれている点が誤りです。

欠損や表記ゆれを残したまま学習すると品質が安定しないため、前処理は学習の前に行います。

B正解

データ収集 → 前処理 → モデル学習 → 評価 → デプロイ → モニタリング

正解。ML 開発は、データ収集・準備(前処理/特徴量)→学習→評価→デプロイ→本番でのモニタリングという流れで進めます。データを整えてから学習し、性能を確かめてから本番へ出します。

C不正解

データ収集 → 前処理 → 評価 → モデル学習 → デプロイ → モニタリング

評価がモデル学習のに置かれている点が誤りです。

評価は学習済みモデルの性能をテストデータで確かめる工程なので、学習の後でなければ実施できません。

D不正解

前処理 → データ収集 → モデル学習 → デプロイ → 評価 → モニタリング

データ収集の前に前処理が置かれ、さらに評価がデプロイのに置かれている点が誤りです。

集めていないデータは前処理できず、評価せずに本番展開するのは品質リスクが大きいため、評価はデプロイの前に行います。

ポイント

正解のライフサイクル順序を押さえます。
・データ収集 →(EDA・前処理・特徴量エンジニアリング)→ モデル学習 → 評価 → デプロイ → モニタリング(→必要なら再学習)。
・データを整えてから学習し、性能を確かめてから本番へ出すのが基本。
『学習が収集より先』『デプロイが評価より先』のような前後の入れ替わりは誤りです。