ある企業が、利用が月数回に集中するキャンペーン機能の推論基盤を設計しています。トラフィックが断続的で予測しにくいワークロードに対し、アイドル時の待機コストをかけずコスト効率よく推論を提供したいと考えています。最も適した推論方式はどれですか。

1 / 1
回答を選択してください
正解D

解説

断続トラフィックにコスト効率よく対応する推論方式を選ぶ問題。

  • 1断続的で予測しにくいトラフィックが 不規則 で常時負荷ではない
  • 2待機コストをかけずコスト効率よく使った分だけ課金・自動スケール=サーバーレス推論
A不正解

リアルタイム推論

リアルタイム推論は常時エンドポイントを起動して低レイテンシで応答する方式で、断続的なトラフィックでも待機分の課金が発生します。

コスト効率を重視する断続トラフィックには最適でないため不正解です。

B不正解

非同期推論

非同期推論は、大きなペイロードをキューに入れて処理する方式で、即時応答が不要な大入力向けです。

断続トラフィックにコスト効率よく応答する目的とは異なるため不正解です。

C不正解

バッチ変換

バッチ変換は、大量データをまとめてオフラインで一括処理する方式です。

断続的なリクエストに応じて推論を提供する目的とは異なるため不正解です。

D正解

サーバーレス推論

正解。サーバーレス推論は、リクエストに応じて自動でスケールし、使った分だけ課金される方式です。断続的で予測しにくいトラフィックに、待機コストをかけずコスト効率よく対応できます。

ポイント

正解の『サーバーレス推論』の特徴を押さえます。
・リクエストに応じて自動スケールし、使った分だけ課金される。
・常時起動が不要なので、断続的で予測しにくいトラフィックにコスト効率よく対応できる。
リアルタイム推論(常時起動・待機課金)・非同期推論(大入力キュー)・バッチ変換(大量一括)とは適する場面が違います。