A正解
ファインチューニング
正解。ファインチューニングは、事前学習済みの基盤モデルを、ラベル付きデータで追加学習して特定のタスクや分野に適応させる段階です。比較的少量のデータで挙動を調整できます。
事前トレーニングとの違いは、事前トレーニングが大量のラベルなしデータでゼロから汎用知識を獲得させる工程(膨大なデータと計算が必要)であるのに対し、ファインチューニングはすでに汎用能力を持つモデルに少量のラベル付きデータを足して特定用途へ寄せる点です。
ある企業が、汎用の応答しかできない事前学習済みの基盤モデルを、自社の特定タスク向けに、ラベル付きデータで追加学習して適応させようとしています。この作業が該当するライフサイクルの段階はどれですか。
特定タスクに適応させる段階を選ぶ問題。
ファインチューニング
正解。ファインチューニングは、事前学習済みの基盤モデルを、ラベル付きデータで追加学習して特定のタスクや分野に適応させる段階です。比較的少量のデータで挙動を調整できます。
事前トレーニングとの違いは、事前トレーニングが大量のラベルなしデータでゼロから汎用知識を獲得させる工程(膨大なデータと計算が必要)であるのに対し、ファインチューニングはすでに汎用能力を持つモデルに少量のラベル付きデータを足して特定用途へ寄せる点です。
事前トレーニング
事前トレーニングは、ラベルなし大量データで汎用知識を一から獲得させる段階です。
事前学習済みモデルを特定タスクに適応させる段階ではないため不正解です。
データ選択
データ選択は、学習に使うデータを決める最初の段階です。
モデルを特定タスクに追加学習して適応させる段階ではないため不正解です。
デプロイ
デプロイは、完成したモデルを本番環境に展開する段階です。
モデルを特定タスクに追加学習して適応させる段階ではないため不正解です。
正解の『ファインチューニング』の位置づけを押さえます。
・事前学習済みの基盤モデルを、ラベル付きデータで追加学習して特定タスクに適応させる。
・事前トレーニングより少ないデータ・計算で、タスクに合った挙動・用語・出力形式を作り込める。
データ選択(最初)・事前トレーニング(汎用学習)・デプロイ(展開)とは段階が違います。