Une entreprise souhaite extraire automatiquement non seulement le texte, mais aussi les tableaux et les champs de formulaires en tant que données structurées à partir d'images de documents numérisés tels que des factures et des formulaires de demande. Quel service AWS est LE PLUS adapté à cette exigence ?

1 / 1
Sélectionnez une réponse
CorrectD

Explication

Question demandant de sélectionner le service d'IA qui extrait des données à partir d'images de documents.

  • 1images de documents numérisésDocuments numérisés ou PDF en entrée = Textract
  • 2tableaux et les champs de formulairesExtraction structurelle au-delà du simple OCR
  • 3extraire automatiquementAutomatise le traitement des documents = Textract
  • 4données structuréesSortie sous forme de données structurées = Textract
AIncorrect

Amazon Rekognition

Amazon Rekognition est un service d'analyse d'images qui détecte des objets, des scènes, des visages et des éléments similaires dans des images et des vidéos, avec une capacité de détection de texte limitée.

Toutefois, la fonction spécifique aux documents consistant à extraire des tableaux et des champs de formulaires en tant que données structurées est le rôle de Textract, donc incorrecte.

BIncorrect

Amazon Transcribe

Amazon Transcribe est un service de reconnaissance vocale qui transcrit l'audio en texte.

Bien que son nom ressemble à Textract, son entrée est de l'audio ou des données enregistrées, et il ne peut pas répondre à cette exigence d'extraction de tableaux et de formulaires à partir d'images de documents numérisés, donc incorrect.

CIncorrect

Amazon Comprehend

Amazon Comprehend est un service NLP qui extrait les sentiments et les entités du texte.

Le rôle OCR de lecture des caractères et des tableaux dans les images de documents appartient à Textract, donc incorrect.

DCorrect

Amazon Textract

C'est correct. Amazon Textract est un service d'IA qui extrait automatiquement le texte (OCR), les tableaux et les champs de formulaires en tant que données structurées à partir d'images de documents et de PDF. Il est utilisé pour automatiser le traitement des factures, des formulaires de demande et des documents commerciaux.

À retenir

« Extraire texte, tableaux et formulaires depuis des images de documents » pointe vers Amazon Textract (OCR + extraction structurelle). La détection d'objets/visages dans les images, c'est Rekognition. Transcribe, au nom similaire, gère la transcription vocale. Distinguer par « qu'extrait-on de quoi ».