A不正解
推論時の温度の設定が高すぎるから
温度は出力のランダム性を調整するパラメータで、設定を変えても、モデルが学習していない情報を答えられるようにはなりません。
知識の有無とは別の話のため不正解です。
ある AI チームが、RAG 導入の理由を経営層に説明しています。基盤モデル (FM) は、追加の仕組みなしでは、社内の最新文書や公開後に起きた出来事について正確に答えられないことがあります。その根本的な理由として最も適切なものはどれですか。
FM が最新・社内情報に答えられない根本理由を選ぶ問題。
推論時の温度の設定が高すぎるから
温度は出力のランダム性を調整するパラメータで、設定を変えても、モデルが学習していない情報を答えられるようにはなりません。
知識の有無とは別の話のため不正解です。
コンテキストウィンドウが大きすぎるから
コンテキストウィンドウは一度に渡せる入力量の上限で、大きいほど長文を扱えます。
最新・社内情報を知らない理由とは無関係のため不正解です。
学習データに含まれない情報はそもそも知らないから
正解。FM は学習に使ったデータの範囲しか知りません。学習時点(カットオフ)より後の出来事や、学習に含まれない社内固有の情報は持っていないため、追加の仕組み(RAG など)がないと正確に答えられません。
トークン化の方式が古いから
トークン化はテキストを処理単位に分割する方式で、知識の有無とは関係しません。
最新・社内情報を知らない理由は学習データの範囲にあるため不正解です。
正解の理解は『FM は学習データの範囲しか知らない』。
・学習の締め切り(カットオフ)より後の出来事は知らない。
・学習に含まれない社内固有の情報も知らない。
・だから RAG で外部から最新/社内情報を取得して補う。
温度(ランダム性)・コンテキストウィンドウ(入力容量)・トークン化(分割方式)は、知識を持たない根本理由とは無関係です。