¿Qué servicio puede ejecutar, sin servidor, el proceso de ETL que extrae datos de diversos orígenes de datos, los transforma a una forma apta para el análisis y los carga en otro destino?

1 / 1
Selecciona una respuesta
CorrectoB

Explicación

Selección de un servicio que realiza ETL sin servidor.

  • 1extrae datosLa extracción (Extract) del ETL
  • 2los transforma a una forma apta para el análisis y los carga en otro destinoLa transformación/carga (Transform/Load) del ETL = Glue
  • 3proceso de ETLEl uso principal de Glue
AIncorrecto

Amazon EMR

Amazon EMR es una plataforma de procesamiento de big data que ejecuta Spark y Hadoop en un clúster.

Puede gestionar procesamiento a gran escala, pero implica configurar y gestionar un clúster, por lo que el requisito de ETL gestionado y sin servidor lo cumple Glue, y esto es incorrecto.

BCorrecto

AWS Glue

Correcto. AWS Glue es un servicio gestionado que puede ejecutar la extracción, transformación y carga (ETL) sin servidor. Detecta automáticamente los orígenes de datos, crea un catálogo de datos y ejecuta trabajos de transformación para dar a los datos una forma apta para el análisis. No requiere gestión de servidores.

CIncorrecto

Amazon Data Firehose

Amazon Data Firehose es un servicio que entrega de forma continua datos de streaming a destinos como S3 mientras los transforma.

Está orientado a la carga de datos que fluyen de forma continua, por lo que el requisito de extracción, transformación y carga (ETL) por lotes desde diversos orígenes lo cumple Glue, y esto es incorrecto.

DIncorrecto

AWS Lambda

AWS Lambda es un servicio de ejecución de código sin servidor de propósito general y se puede usar para pequeñas transformaciones de datos.

Sin embargo, no tiene mecanismos específicos de ETL como un catálogo de datos, rastreadores o gestión de trabajos y tiene un límite de tiempo de ejecución, por lo que el requisito de ETL gestionado lo cumple Glue, y esto es incorrecto.

Punto clave

'ETL', 'extracción, transformación, carga' y 'sin servidor' apuntan a AWS Glue. Las consultas SQL son Athena, la visualización es QuickSight y el streaming es Kinesis, por lo que las funciones se reparten en la canalización de análisis.