ある EC 企業が、ユーザーの操作に応じて、一貫して低い遅延でその場ですぐに予測結果を返すレコメンドのライブ機能を作りたいと考えています。トラフィックは日中を通じて安定して発生する想定です。最も適した推論方式はどれですか。

1 / 1
回答を選択してください
正解A

解説

低レイテンシのライブ予測に適した推論方式を選ぶ問題。

  • 1一貫して低い遅延で安定して低レイテンシ で返す必要がある
  • 2その場ですぐに予測結果を返す同期的な即時応答=リアルタイム推論
A正解

リアルタイム推論

正解。リアルタイム推論は、リクエストを同期的に処理し、一貫して低レイテンシで予測を返す方式です。インタラクティブなライブ予測に適しています。

B不正解

バッチ変換

バッチ変換は、大量のデータをまとめてオフラインで処理する方式です。

その場で即座に結果を返す用途には向かないため不正解です。

C不正解

非同期推論

非同期推論は、大きなペイロードをキューに入れて処理し、即時の同期応答を必要としない場合に使う方式です。

一貫して低レイテンシで即座に返す用途とは異なるため不正解です。

D不正解

サーバーレス推論

サーバーレス推論は、断続的で予測しにくいトラフィックにコスト効率よく対応する方式ですが、起動に時間がかかることがあり、一貫した低レイテンシは保証しにくいです。

常に低遅延で即応する用途には最適でないため不正解です。

ポイント

正解の『リアルタイム推論』の特徴を押さえます。
・リクエストを同期処理し、一貫して低レイテンシで即座に予測を返す。
・インタラクティブなライブ予測に最適。
バッチ変換(大量一括オフライン)・非同期推論(大ペイロード/キュー/即時不要)・サーバーレス推論(断続トラフィック)とは適する場面が違います。