Una empresa desea extraer automáticamente no solo texto, sino también tablas y campos de formularios como datos estructurados a partir de imágenes de documentos escaneados como facturas y formularios de solicitud. ¿Qué servicio de AWS es el MÁS adecuado para este requisito?

1 / 1
Selecciona una respuesta
CorrectoD

Explicación

Pregunta que solicita seleccionar el servicio de IA que extrae datos de imágenes de documentos.

  • 1imágenes de documentos escaneadosDocumentos escaneados o PDF como entrada = Textract
  • 2tablas y campos de formulariosExtracción estructural más allá del OCR simple
  • 3extraer automáticamenteAutomatiza el procesamiento de documentos = Textract
  • 4datos estructuradosSalida como datos estructurados = Textract
AIncorrecto

Amazon Rekognition

Amazon Rekognition es un servicio de análisis de imágenes que detecta objetos, escenas, rostros y elementos similares en imágenes y videos, con capacidad limitada de detección de texto.

Sin embargo, la función específica de documentos de extraer tablas y campos de formularios como datos estructurados de facturas y formularios corresponde a Textract, por lo que es incorrecto.

BIncorrecto

Amazon Transcribe

Amazon Transcribe es un servicio de reconocimiento de voz que transcribe audio a texto.

Aunque su nombre se asemeja a Textract, su entrada son datos de audio o grabaciones, y no puede satisfacer el requisito de extraer tablas y formularios de imágenes de documentos escaneados, por lo que es incorrecto.

CIncorrecto

Amazon Comprehend

Amazon Comprehend es un servicio de NLP que extrae sentimientos y entidades del texto.

La función de OCR para leer caracteres y tablas desde imágenes de documentos corresponde a Textract, por lo que es incorrecto.

DCorrecto

Amazon Textract

Correcto. Amazon Textract es un servicio de IA que extrae automáticamente texto (OCR), tablas y campos de formularios como datos estructurados a partir de imágenes de documentos y PDF. Se utiliza para automatizar el procesamiento de facturas, formularios de solicitud y documentos comerciales.

Punto clave

«Extraer texto, tablas y formularios de imágenes de documentos» apunta a Amazon Textract (OCR + extracción estructural). La detección de objetos/rostros en imágenes corresponde a Rekognition. Transcribe, de nombre similar, maneja la transcripción de voz. Distinguir por «qué se extrae de qué».