Dịch vụ AWS nào cho phép chạy các truy vấn SQL chuẩn trực tiếp trên dữ liệu được lưu trữ trong Amazon S3 mà không cần cung cấp máy chủ, và tính phí dựa trên lượng dữ liệu được quét?

1 / 1
Hãy chọn một đáp án
ĐúngC

Giải thích

Câu hỏi yêu cầu chọn dịch vụ chạy truy vấn SQL serverless vào S3.

  • 1dữ liệu được lưu trữ trong Amazon S3Mục tiêu truy vấn là dữ liệu nằm trên S3
  • 2truy vấn SQL chuẩn trực tiếpPhân tích ad hoc bằng SQL = Athena
  • 3tính phí dựa trên lượng dữ liệu được quétTính phí serverless theo lượng quét = Athena
ASai

Amazon Redshift

Amazon Redshift là kho dữ liệu được thiết kế để thực thi các phép tổng hợp phức tạp trên tập dữ liệu lớn với tốc độ cao.

Mô hình sử dụng cơ bản của nó liên quan đến việc cung cấp cluster làm nền tảng thực thi. Mô tả trong câu hỏi này — «không cần máy chủ, SQL trực tiếp vào S3, tính phí theo lượng quét» — phù hợp với Athena, không phải Redshift. Đáp án này không chính xác.

BSai

Amazon EMR

Amazon EMR là nền tảng xử lý big data chạy các framework như Spark và Hadoop trên cluster.

Nó liên quan đến việc cấu hình và quản lý cluster. Đối với yêu cầu truy vấn dữ liệu S3 trực tiếp bằng SQL chuẩn mà không cần cung cấp máy chủ, Athena phù hợp hơn. Đáp án này không chính xác.

CĐúng

Amazon Athena

Chính xác. Amazon Athena là dịch vụ truy vấn serverless cho phép chạy các truy vấn SQL chuẩn trực tiếp trên dữ liệu được lưu trữ trong Amazon S3. Không cần thiết lập hay quản lý máy chủ, và phí được tính dựa trên lượng dữ liệu được quét bởi mỗi truy vấn. Rất phù hợp để phân tích log và phân tích ad hoc.

DSai

AWS Glue

AWS Glue là dịch vụ ETL serverless trích xuất, chuyển đổi và tải dữ liệu.

Mặc dù là serverless, vai trò của nó là chuyển đổi và tích hợp dữ liệu, không phải chạy truy vấn SQL ad hoc trên dữ liệu S3 để lấy kết quả ngay lập tức. Đáp án này không chính xác.

Điểm cần nhớ

«SQL vào S3», «serverless» và «tính phí theo lượng quét» đều trỏ đến Amazon Athena. Phân biệt: kho dữ liệu quy mô lớn = Redshift, ETL = Glue, trực quan hóa = QuickSight.