ある企業が基盤モデル (FM) の開発コストを試算しています。FM のライフサイクルで、ラベルのない大量のデータを使ってモデルに言語や世界の汎用的な知識を獲得させる、最も計算コストの大きい段階はどれですか。

1 / 1
回答を選択してください
正解D

解説

汎用知識を獲得する大規模学習の段階を選ぶ問題。

  • 1ラベルのない大量のデータラベルなしで大規模に学習する
  • 2汎用的な知識を獲得させる基盤を作る=事前トレーニング
  • 3計算コストの大きい段階膨大な計算を要する事前トレーニングの特徴
A不正解

ファインチューニング

ファインチューニングは、事前学習済みモデルを比較的少量のラベル付きデータで特定タスクに適応させる段階で、計算コストは事前トレーニングよりずっと小さいです。

汎用知識を一から獲得する段階ではないため不正解です。

B不正解

評価

評価は、学習したモデルの性能をテストデータなどで測る段階です。

モデルに汎用知識を獲得させる大規模学習の段階ではないため不正解です。

C不正解

デプロイ

デプロイは、完成したモデルを本番環境に展開する段階です。

モデルに汎用知識を獲得させる大規模学習の段階ではないため不正解です。

D正解

事前トレーニング

正解。事前トレーニングは、ラベルのない大量のデータでモデルに汎用的な知識を獲得させる段階で、膨大な計算コストがかかります。ここで作られた基盤モデルを後で各タスクに適応させます。

ポイント

正解の『事前トレーニング』の位置づけを押さえます。
・ラベルなしの大量データで汎用的な知識を獲得させる、最も計算コストの大きい段階。
・ここで作られた基盤モデルを、後でファインチューニング等で各タスクに適応させる。
ファインチューニング(少量で特定タスクに適応)・評価・デプロイは後の段階で、計算コストも小さめです。