A不正解
温度
温度は確率分布全体の鋭さ(ランダム性)を調整するパラメータで、累積確率で候補を絞り込む制御ではありません。
候補の絞り方を累積確率で決めるものではないため不正解です。
ある開発者が、次のトークンの候補を確率の高い順に足していき、累積確率が指定した割合に達するまでの候補だけに絞ってから選ばせたいと考えています。この制御を行う推論パラメータはどれですか。
累積確率で候補を絞る推論パラメータを選ぶ問題。
温度
温度は確率分布全体の鋭さ(ランダム性)を調整するパラメータで、累積確率で候補を絞り込む制御ではありません。
候補の絞り方を累積確率で決めるものではないため不正解です。
最大トークン数
最大トークン数は、出力の長さの上限を決めるパラメータです。
候補を累積確率で絞り込む制御ではないため不正解です。
コンテキストウィンドウ
コンテキストウィンドウは、一度に渡せる入力量の上限に関わる要素です。
候補を累積確率で絞り込む制御ではないため不正解です。
Top-P
正解。Top-P(核サンプリング)は、確率の高い順に候補を足し、累積確率が指定割合 P に達するまでの候補だけを残してから選ばせます。P を小さくすると候補が絞られて出力が安定し、大きくすると多様になります。
正解の『Top-P』が効く仕組みを押さえます。
・確率の高い順に候補を足し、累積確率が割合 P に達するまでの候補だけを残す(核サンプリング)。
・P を小さくすると候補が減って安定、大きくすると多様。
・Top-K は『上位 K 個』で絞る(個数)、Top-P は『累積確率 P』で絞る(確率の合計)点が違う。
温度は分布全体の鋭さ、最大トークン数は長さで役割が別です。