A不正解
リアルタイム推論
リアルタイム推論は常時エンドポイントを起動して低レイテンシで応答する方式で、断続的なトラフィックでも待機分の課金が発生します。
コスト効率を重視する断続トラフィックには最適でないため不正解です。
ある企業が、利用が月数回に集中するキャンペーン機能の推論基盤を設計しています。トラフィックが断続的で予測しにくいワークロードに対し、アイドル時の待機コストをかけずコスト効率よく推論を提供したいと考えています。最も適した推論方式はどれですか。
断続トラフィックにコスト効率よく対応する推論方式を選ぶ問題。
リアルタイム推論
リアルタイム推論は常時エンドポイントを起動して低レイテンシで応答する方式で、断続的なトラフィックでも待機分の課金が発生します。
コスト効率を重視する断続トラフィックには最適でないため不正解です。
非同期推論
非同期推論は、大きなペイロードをキューに入れて処理する方式で、即時応答が不要な大入力向けです。
断続トラフィックにコスト効率よく応答する目的とは異なるため不正解です。
バッチ変換
バッチ変換は、大量データをまとめてオフラインで一括処理する方式です。
断続的なリクエストに応じて推論を提供する目的とは異なるため不正解です。
サーバーレス推論
正解。サーバーレス推論は、リクエストに応じて自動でスケールし、使った分だけ課金される方式です。断続的で予測しにくいトラフィックに、待機コストをかけずコスト効率よく対応できます。
正解の『サーバーレス推論』の特徴を押さえます。
・リクエストに応じて自動スケールし、使った分だけ課金される。
・常時起動が不要なので、断続的で予測しにくいトラフィックにコスト効率よく対応できる。
リアルタイム推論(常時起動・待機課金)・非同期推論(大入力キュー)・バッチ変換(大量一括)とは適する場面が違います。