A正解
処理した入力・出力のトークン数
正解。Bedrock のオンデマンド利用は、処理した入力トークン数と出力トークン数に基づく従量課金が基本です。使った分だけ支払います。
ある企業が、Amazon Bedrock の利用コストの見積もりを作っています。Bedrock のオンデマンド利用では、料金が主に何に基づいて課金されますか。最も適切なものはどれですか。
Bedrock のオンデマンド課金の基準を選ぶ問題。
処理した入力・出力のトークン数
正解。Bedrock のオンデマンド利用は、処理した入力トークン数と出力トークン数に基づく従量課金が基本です。使った分だけ支払います。
プロビジョニングしたエンドポイントの稼働時間
稼働時間ベースの課金は、プロビジョンドスループットなど確保型の利用形態の考え方です。
オンデマンド利用では使った分だけのトークン数で課金されるため不正解です。
モデルの学習に使った GPU 時間
GPU 時間は、自前でモデルを学習する場合のコストの考え方です。
Bedrock のオンデマンド推論は学習を伴わず、課金は入出力トークン数のため不正解です。
保存しているプロンプトの件数
プロンプトの保存件数は、オンデマンド推論の課金基準ではありません。
課金は処理した入力・出力のトークン数に基づくため不正解です。
Amazon Bedrock のオンデマンド利用は『処理した入力トークン数と出力トークン数に基づく従量課金』が基本です。長いプロンプトや長い応答ほどトークンが増えコストも増えます。コストを抑えるにはプロンプトと出力のトークン量を意識します。