Re[2]: SOTA text in the wild
От: Артём Австралия жж
Дата: 29.05.23 15:07
Оценка:
Здравствуйте, Nuzhny, Вы писали:

N>Я лет 10 не в теме, но коллеги из открытого сейчас хвалят 2 библиотеки: PaddleOCR и mmocr. У каждой свои недостатки, но в целом намного впереди tesseract практически во всех задачах


Я попробовал PaddleOCR их демо- загружает картинку на бек Байду и занимает 3 секунды на распознавание. Самое точное, но бывает в 1 номере в коде ошибается.
PaddleJS демо- ну хз, не сказать, что прямо лучше чем Tesseract WASM демо. Та же самая картинка, paddle её не видит совсем, а tesseract видит, но гонит — много ошибок в коде.
У PaddleJS нахождение text box (когда он видит) сделано лучше: по 4 точкам линии. В то время, как тессеракт рисует большие параллелепипеды при наклоне текста.

У встроенной фото софтины Галакси Таб оказывается, тоже есть распознавание. Только нужно кликнуть на один из подсвеченных текст боксов, и оно копирует распознанный текст в буфер обмена. Оно схватило букву от другого слова и ошиблось в 1 номере в коде.


А что интересно есть такое, чтобы зацепить символы по отдельности и самому попытаться склеить их в слова? Как каждым отдельным символом "дотренировывать" CNN, если ошибка и он изменён пользователем?
Отредактировано 29.05.2023 15:17 Артём . Предыдущая версия .
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.