Amazon Redshift
Amazon Redshift は、大量データの複雑な集計を高速実行する データウェアハウス です。
クラスタという 実行基盤をプロビジョニングして利用する のが基本であり、『サーバを用意せず S3 に直接 SQL・スキャン量課金』という本問の説明は Athena に該当するため不正解です。
Amazon S3 に保存されたデータに対して、サーバを用意せず標準 SQL で直接クエリを実行し、スキャンしたデータ量に応じて課金されるサービスはどれですか。
S3 にサーバーレスで SQL クエリするサービスを選ぶ問題。
Amazon Redshift
Amazon Redshift は、大量データの複雑な集計を高速実行する データウェアハウス です。
クラスタという 実行基盤をプロビジョニングして利用する のが基本であり、『サーバを用意せず S3 に直接 SQL・スキャン量課金』という本問の説明は Athena に該当するため不正解です。
Amazon EMR
Amazon EMR は、Spark や Hadoop などの フレームワークをクラスタ上で実行する ビッグデータ処理基盤です。
クラスタの構成・管理を伴うため、サーバを用意せず標準 SQL だけで S3 に直接クエリする という本問の要件には Athena が適するため不正解です。
Amazon Athena
正解。Amazon Athena は、S3 に保存されたデータに対して標準 SQL で直接クエリを実行できるサーバーレスのクエリサービスです。サーバの構築・管理は不要で、実行したクエリがスキャンしたデータ量に応じて課金されます。ログ分析やアドホックな分析に手軽に使えます。
AWS Glue
AWS Glue は、データの抽出・変換・ロードを行う サーバーレスの ETL サービス です。
サーバーレスという点は共通ですが、役割は データの変換・統合 であり、S3 のデータへ その場で SQL クエリを実行して結果を得る サービスではないため不正解です。
『S3 に SQL』『サーバーレス』『スキャン量課金』は Amazon Athena。大規模 DWH は Redshift、ETL は Glue、可視化は QuickSight と分析系を切り分ける。