汎用知識を獲得する大規模学習の段階を選ぶ問題。

ある企業が基盤モデル (FM) の開発コストを試算しています。FM のライフサイクルで、ラベルのない大量のデータを使ってモデルに言語や世界の汎用的な知識を獲得させる、最も計算コストの大きい段階はどれですか。

1 / 1

回答を選択してください

正解D

解説

問題の概要

汎用知識を獲得する大規模学習の段階を選ぶ問題。

満たすべき条件

1「ラベルのない大量のデータ」ラベルなしで大規模に学習する
2「汎用的な知識を獲得させる」基盤を作る＝事前トレーニング
3「計算コストの大きい段階」膨大な計算を要する事前トレーニングの特徴

選択肢ごとの解説

A不正解

ファインチューニング

ファインチューニングは、事前学習済みモデルを比較的少量のラベル付きデータで特定タスクに適応させる段階で、計算コストは事前トレーニングよりずっと小さいです。

汎用知識を一から獲得する段階ではないため不正解です。

B不正解

評価

評価は、学習したモデルの性能をテストデータなどで測る段階です。

モデルに汎用知識を獲得させる大規模学習の段階ではないため不正解です。

C不正解

デプロイ

デプロイは、完成したモデルを本番環境に展開する段階です。

モデルに汎用知識を獲得させる大規模学習の段階ではないため不正解です。

D正解

事前トレーニング

正解。事前トレーニングは、ラベルのない大量のデータでモデルに汎用的な知識を獲得させる段階で、膨大な計算コストがかかります。ここで作られた基盤モデルを後で各タスクに適応させます。

ポイント

正解の『事前トレーニング』の位置づけを押さえます。
・ラベルなしの大量データで汎用的な知識を獲得させる、最も計算コストの大きい段階。
・ここで作られた基盤モデルを、後でファインチューニング等で各タスクに適応させる。
ファインチューニング（少量で特定タスクに適応）・評価・デプロイは後の段階で、計算コストも小さめです。

解説

💡ポイント

関連リンク

ポイント