累積確率で候補を絞る推論パラメータを選ぶ問題。

ある開発者が、次のトークンの候補を確率の高い順に足していき、累積確率が指定した割合に達するまでの候補だけに絞ってから選ばせたいと考えています。この制御を行う推論パラメータはどれですか。

1 / 1

回答を選択してください

正解D

解説

問題の概要

累積確率で候補を絞る推論パラメータを選ぶ問題。

満たすべき条件

1「累積確率が指定した割合に達するまでの候補だけに絞って」確率の合計で候補を絞る＝Top-P（個数で絞る Top-K と区別）

選択肢ごとの解説

A不正解

温度

温度は確率分布全体の鋭さ（ランダム性）を調整するパラメータで、累積確率で候補を絞り込む制御ではありません。

候補の絞り方を累積確率で決めるものではないため不正解です。

B不正解

最大トークン数

最大トークン数は、出力の長さの上限を決めるパラメータです。

候補を累積確率で絞り込む制御ではないため不正解です。

C不正解

コンテキストウィンドウ

コンテキストウィンドウは、一度に渡せる入力量の上限に関わる要素です。

候補を累積確率で絞り込む制御ではないため不正解です。

D正解

Top-P

正解。Top-P（核サンプリング）は、確率の高い順に候補を足し、累積確率が指定割合 P に達するまでの候補だけを残してから選ばせます。P を小さくすると候補が絞られて出力が安定し、大きくすると多様になります。

ポイント

正解の『Top-P』が効く仕組みを押さえます。
・確率の高い順に候補を足し、累積確率が割合 P に達するまでの候補だけを残す（核サンプリング）。
・P を小さくすると候補が減って安定、大きくすると多様。
・Top-K は『上位 K 個』で絞る（個数）、Top-P は『累積確率 P』で絞る（確率の合計）点が違う。
温度は分布全体の鋭さ、最大トークン数は長さで役割が別です。

解説

💡ポイント

関連リンク

ポイント