한국의 경우는 특히나 Form 형태(테이블)의 문서가 많아서, 텍스트추출만 비교하기 보다는 테이블 인식쪽 비교 테스트가 필요하긴 할듯.

테이블이 포함된 복합문서 인식에 있어서는 모두들 추가로 서비스를 제공중

Azure Form Recognizer - https://azure.microsoft.com/en-us/services/…
Google Document Understanding AI - https://cloud.google.com/solutions/document-understanding/
Amazon Textract Form Extraction - https://docs.aws.amazon.com/textract/latest/…