レイテンシー
正解。レイテンシーは応答が返り始めるまでの速さを表す基準です。チャットの体験は最初の応答までの待ち時間で決まるため、本問の『速さが体験を左右する』という要件に直接対応します。
AI プラクティショナーが、社内向け FAQ チャットボット(日本語のみ・テキストのみ・モデルの追加調整は不要)に使う基盤モデルを Amazon Bedrock で比較しています。応答が返り始めるまでの速さが体験を左右し、大量の質問を継続処理するため請求の抑制も必要です。この要件に直接対応する選択基準を 2 つ選んでください。
シナリオの要件に直接対応する選択基準を 2 つ選ぶ問題。
レイテンシー
正解。レイテンシーは応答が返り始めるまでの速さを表す基準です。チャットの体験は最初の応答までの待ち時間で決まるため、本問の『速さが体験を左右する』という要件に直接対応します。
多言語対応
多言語対応は扱える言語の幅を表す正当な選択基準で、複数言語のユーザーに応答したいときに重視します。
ただし本問は『日本語のみ』と明記されており、ほとんどのモデルが要件を満たすため、候補を絞る決め手にはならず不正解です。
推論コスト
正解。推論コストはトークン単価などの請求に関わる基準です。大量の質問を継続処理すると消費トークンが積み上がるため、本問の『請求の抑制』という要件に直接対応します。
マルチモーダル対応
マルチモーダル対応(モダリティ)は扱える入出力の種類を表す正当な基準で、画像や音声を扱うときは最優先で確認します。
ただし本問は『テキストのみ』と明記されており、画像・音声対応は要件に含まれないため不正解です。
カスタマイズ性
カスタマイズ性はファインチューニングなどで自社向けに調整しやすいかを表す正当な基準で、独自の挙動や文体を作り込みたいときに重視します。
ただし本問は『モデルの追加調整は不要』と明記されているため、決め手にはならず不正解です。
モデルの選択基準は『コスト / レイテンシー / モダリティ / 多言語対応 / モデルサイズ / カスタマイズ性』とどれも正当ですが、シナリオの要件に直接対応するものだけを選ぶのがこの形式のポイントです。本問では『速さ=レイテンシー』『請求=推論コスト』が該当し、日本語のみ・テキストのみ・調整不要という前提が残りの基準を消去する条件になっています。