ある企業が、基盤モデルのライフサイクルに沿って品質確認の計画を立てています。本番にデプロイする前に、テストデータやベンチマークでモデルの性能・品質を測って良し悪しを確かめる段階はどれですか。

1 / 1
回答を選択してください
正解C

解説

デプロイ前に性能を測る段階を選ぶ問題。

  • 1本番にデプロイする前にデプロイ の段階
  • 2性能・品質を測って良し悪しを確かめるテスト/ベンチマークで測定=評価
A不正解

事前トレーニング

事前トレーニングは、ラベルなし大量データで汎用知識を獲得させる学習段階です。

デプロイ前に性能を測る段階ではないため不正解です。

B不正解

フィードバック

フィードバックは、デプロイ後に本番での挙動やユーザーの反応を収集して改善に活かす段階です。

デプロイ前に性能を測る段階ではないため不正解です。

C正解

評価

正解。評価は、本番デプロイ前にテストデータやベンチマークでモデルの性能・品質(正解率・ROUGE など)を測る段階で、要件を満たすか確かめます。

D不正解

デプロイ

デプロイは、評価を終えたモデルを本番に展開する段階そのものです。

性能を測って良し悪しを確かめる段階ではないため不正解です。

ポイント

正解の『評価』の位置づけを押さえます。
・本番デプロイ前に、テストデータやベンチマークで性能・品質(正解率・ROUGE など)を測り、要件を満たすか確かめる。
・問題があれば再学習・調整に戻る。
事前トレーニング(学習)・フィードバック(デプロイ後の反応収集)・デプロイ(展開)とは段階が違います。