A正解
リアルタイム推論
正解。リアルタイム推論は、リクエストを同期的に処理し、一貫して低レイテンシで予測を返す方式です。インタラクティブなライブ予測に適しています。
ある EC 企業が、ユーザーの操作に応じて、一貫して低い遅延でその場ですぐに予測結果を返すレコメンドのライブ機能を作りたいと考えています。トラフィックは日中を通じて安定して発生する想定です。最も適した推論方式はどれですか。
低レイテンシのライブ予測に適した推論方式を選ぶ問題。
リアルタイム推論
正解。リアルタイム推論は、リクエストを同期的に処理し、一貫して低レイテンシで予測を返す方式です。インタラクティブなライブ予測に適しています。
バッチ変換
バッチ変換は、大量のデータをまとめてオフラインで処理する方式です。
その場で即座に結果を返す用途には向かないため不正解です。
非同期推論
非同期推論は、大きなペイロードをキューに入れて処理し、即時の同期応答を必要としない場合に使う方式です。
一貫して低レイテンシで即座に返す用途とは異なるため不正解です。
サーバーレス推論
サーバーレス推論は、断続的で予測しにくいトラフィックにコスト効率よく対応する方式ですが、起動に時間がかかることがあり、一貫した低レイテンシは保証しにくいです。
常に低遅延で即応する用途には最適でないため不正解です。
正解の『リアルタイム推論』の特徴を押さえます。
・リクエストを同期処理し、一貫して低レイテンシで即座に予測を返す。
・インタラクティブなライブ予測に最適。
バッチ変換(大量一括オフライン)・非同期推論(大ペイロード/キュー/即時不要)・サーバーレス推論(断続トラフィック)とは適する場面が違います。