Một công ty muốn tự động trích xuất không chỉ văn bản mà còn bảng và trường biểu mẫu dưới dạng dữ liệu có cấu trúc từ hình ảnh tài liệu được quét như hóa đơn và đơn đăng ký. Dịch vụ AWS nào PHÙ HỢP NHẤT với yêu cầu này?

1 / 1
Hãy chọn một đáp án
ĐúngD

Giải thích

Câu hỏi yêu cầu chọn dịch vụ AI trích xuất dữ liệu từ hình ảnh tài liệu.

  • 1hình ảnh tài liệu được quétTài liệu quét hoặc PDF làm đầu vào = Textract
  • 2bảng và trường biểu mẫuTrích xuất cấu trúc vượt ra ngoài OCR đơn giản
  • 3tự động trích xuấtTự động hóa xử lý tài liệu = Textract
  • 4dữ liệu có cấu trúcĐầu ra dưới dạng dữ liệu có cấu trúc = Textract
ASai

Amazon Rekognition

Amazon Rekognition là dịch vụ phân tích hình ảnh phát hiện vật thể, cảnh, khuôn mặt và các yếu tố tương tự từ hình ảnh và video, với khả năng phát hiện văn bản hạn chế.

Tuy nhiên, chức năng đặc thù cho tài liệu là trích xuất bảng và trường biểu mẫu dưới dạng dữ liệu có cấu trúc thuộc về Textract, do đó không chính xác.

BSai

Amazon Transcribe

Amazon Transcribe là dịch vụ nhận dạng giọng nói chuyển đổi âm thanh thành văn bản.

Mặc dù tên gần giống Textract, đầu vào của nó là dữ liệu âm thanh hoặc ghi âm, và không thể đáp ứng yêu cầu trích xuất bảng và biểu mẫu từ hình ảnh tài liệu được quét, do đó không chính xác.

CSai

Amazon Comprehend

Amazon Comprehend là dịch vụ NLP trích xuất cảm xúc và thực thể từ văn bản.

Vai trò OCR đọc ký tự và bảng từ hình ảnh tài liệu thuộc về Textract, do đó không chính xác.

DĐúng

Amazon Textract

Đúng. Amazon Textract là dịch vụ AI tự động trích xuất văn bản (OCR), bảng và trường biểu mẫu dưới dạng dữ liệu có cấu trúc từ hình ảnh tài liệu và PDF. Được sử dụng để tự động hóa xử lý hóa đơn, đơn đăng ký và tài liệu kinh doanh.

Điểm cần nhớ

«Trích xuất văn bản, bảng và biểu mẫu từ hình ảnh tài liệu» chỉ về Amazon Textract (OCR + trích xuất cấu trúc). Phát hiện vật thể/khuôn mặt trong ảnh là Rekognition. Transcribe có tên tương tự xử lý chuyển đổi giọng nói. Phân biệt theo «trích xuất gì từ cái gì».