Tesseract.js — JS библиотека для оптического распознавания символов (OCR) .
Tesseract.js ищет шаблоны в пикселях, буквах, словах и предложениях, использует двухэтапный подход, называемый адаптивным распознаванием. Требуется один проход по данным для распознавания символов, затем второй проход, чтобы заполнить любые буквы, в которых он не был уверен, буквами, которые, скорее всего, соответствуют данному слову или контексту предложения.
Особенности / преимущества:
✔️Поддержка нескольких языков одновременно
✔️Открытый исходный код
✔️Автоматическая ориентация текста и определение скрипта
✔️Поддержка WebAssembly
✔️Написана на чистом JavaScript
✔️Простой интерфейс для чтения рамок абзацев, слов и символов
✔️Поддерживает более 100 языков
Сайт:https://tesseract.projectnaptha.com/Гит:https://github.com/naptha/tesseract.js
#js
👉 @bookflow