A不正解
スループット
スループットは単位時間あたりに処理できる量を表す性能指標です。
一度に扱えるトークン量の上限を表す性質ではないため不正解です。
ある法務チームが、長い契約書をまるごと 1 回の入力としてモデルに読み込ませて要約させたいと考えています。モデルが「一度にどれだけのトークンを入力・出力できるか」を表す性質を何と呼びますか。
一度に扱えるトークン量の上限を表す性質を選ぶ問題。
スループット
スループットは単位時間あたりに処理できる量を表す性能指標です。
一度に扱えるトークン量の上限を表す性質ではないため不正解です。
応答の最大トークン数
最大トークン数は、推論パラメータとして出力の長さの上限を指定する設定です。
本問が問うのは、モデルが一度に扱える入力・出力全体の容量(モデル固有の性質)であり、それはコンテキストウィンドウのため不正解です。
語彙サイズ
語彙サイズは、モデルが扱える一意な語(トークンの種類)の数です。
語彙の豊富さの話であり、一度に処理できる量の上限ではないため不正解です。
コンテキストウィンドウ
正解。コンテキストウィンドウは、モデルが一度に扱えるトークン量(入力+出力の上限)を表す性質です。長い文書を扱うにはこれが大きいモデルが向きます。
正解の『コンテキストウィンドウ』を押さえます。
・モデルが一度に扱えるトークン量(入力+出力の上限)を表す性質。
・大きいほど長い文書や多くの会話履歴を一度に渡せ、長文要約などに向く。
スループット(処理量/時間)・学習率・エポック数はいずれも、一度に扱えるトークン量の上限を表す性質ではありません。