В интернете доступна открытая система распознавания текста Tesseract
В открытый доступ выложили систему распознавания текста Tesseract 5.5.0. Проект поддерживает Unicode и работает с более чем 100 языками. Итоговый результат распознавания может сохраняться как открытым текстом, так и в форматах …