ある AI チームが、RAG 導入の理由を経営層に説明しています。基盤モデル (FM) は、追加の仕組みなしでは、社内の最新文書や公開後に起きた出来事について正確に答えられないことがあります。その根本的な理由として最も適切なものはどれですか。

1 / 1
回答を選択してください
正解C

解説

FM が最新・社内情報に答えられない根本理由を選ぶ問題。

  • 1社内の最新文書や公開後に起きた出来事学習に 含まれていない 情報
  • 2正確に答えられないFM は学習データの範囲しか知らない=知識のカットオフ/未学習
A不正解

推論時の温度の設定が高すぎるから

温度は出力のランダム性を調整するパラメータで、設定を変えても、モデルが学習していない情報を答えられるようにはなりません。

知識の有無とは別の話のため不正解です。

B不正解

コンテキストウィンドウが大きすぎるから

コンテキストウィンドウは一度に渡せる入力量の上限で、大きいほど長文を扱えます。

最新・社内情報を知らない理由とは無関係のため不正解です。

C正解

学習データに含まれない情報はそもそも知らないから

正解。FM は学習に使ったデータの範囲しか知りません。学習時点(カットオフ)より後の出来事や、学習に含まれない社内固有の情報は持っていないため、追加の仕組み(RAG など)がないと正確に答えられません。

D不正解

トークン化の方式が古いから

トークン化はテキストを処理単位に分割する方式で、知識の有無とは関係しません。

最新・社内情報を知らない理由は学習データの範囲にあるため不正解です。

ポイント

正解の理解は『FM は学習データの範囲しか知らない』。
・学習の締め切り(カットオフ)より後の出来事は知らない。
・学習に含まれない社内固有の情報も知らない。
・だから RAG で外部から最新/社内情報を取得して補う。
温度(ランダム性)・コンテキストウィンドウ(入力容量)・トークン化(分割方式)は、知識を持たない根本理由とは無関係です。