deepdoctection
Deepdoctection — это библиотека Python, которая использует модели глубокого обучения для извлечения информации PDF, PNG документов и анализа макета документа.
Он не реализует модели, но позволяет создавать конвейеры с использованием широко признанных библиотек для обнаружения объектов, оптического распознавания символов и отдельных задач NLP, а также предоставляет интегрированную платформу для точной настройки, оценки и запуска моделей.
deepdoctection ориентирована на приложения и предназначена для тех, кто хочет решать реальные проблемы, связанные с извлечением документов из PDF-файлов или из сканов в различных форматах изображений.https://github.com/deepdoctection/deepdoctection
HuggingFace: huggingface.co/spaces/…ctection