Pregunta que solicita seleccionar el servicio de…

Una empresa desea extraer automáticamente no solo texto, sino también tablas y campos de formularios como datos estructurados a partir de imágenes de documentos escaneados como facturas y formularios de solicitud. ¿Qué servicio de AWS es el MÁS adecuado para este requisito?

1 / 1

Selecciona una respuesta

CorrectoD

Explicación

Resumen de la pregunta

Pregunta que solicita seleccionar el servicio de IA que extrae datos de imágenes de documentos.

Condiciones a cumplir

1「imágenes de documentos escaneados」Documentos escaneados o PDF como entrada = Textract
2「tablas y campos de formularios」Extracción estructural más allá del OCR simple
3「extraer automáticamente」Automatiza el procesamiento de documentos = Textract
4「datos estructurados」Salida como datos estructurados = Textract

Explicación por opción

AIncorrecto

Amazon Rekognition

Amazon Rekognition es un servicio de análisis de imágenes que detecta objetos, escenas, rostros y elementos similares en imágenes y videos, con capacidad limitada de detección de texto.

Sin embargo, la función específica de documentos de extraer tablas y campos de formularios como datos estructurados de facturas y formularios corresponde a Textract, por lo que es incorrecto.

BIncorrecto

Amazon Transcribe

Amazon Transcribe es un servicio de reconocimiento de voz que transcribe audio a texto.

Aunque su nombre se asemeja a Textract, su entrada son datos de audio o grabaciones, y no puede satisfacer el requisito de extraer tablas y formularios de imágenes de documentos escaneados, por lo que es incorrecto.

CIncorrecto

Amazon Comprehend

Amazon Comprehend es un servicio de NLP que extrae sentimientos y entidades del texto.

La función de OCR para leer caracteres y tablas desde imágenes de documentos corresponde a Textract, por lo que es incorrecto.

DCorrecto

Amazon Textract

Correcto. Amazon Textract es un servicio de IA que extrae automáticamente texto (OCR), tablas y campos de formularios como datos estructurados a partir de imágenes de documentos y PDF. Se utiliza para automatizar el procesamiento de facturas, formularios de solicitud y documentos comerciales.

Punto clave

«Extraer texto, tablas y formularios de imágenes de documentos» apunta a Amazon Textract (OCR + extracción estructural). La detección de objetos/rostros en imágenes corresponde a Rekognition. Transcribe, de nombre similar, maneja la transcripción de voz. Distinguir por «qué se extrae de qué».

Explicación

💡Punto clave

Enlaces relacionados

Punto clave