Re[2]: SOTA text in the wild

Здравствуйте, Nuzhny, Вы писали:

N>Я лет 10 не в теме, но коллеги из открытого сейчас хвалят 2 библиотеки: PaddleOCR и mmocr. У каждой свои недостатки, но в целом намного впереди tesseract практически во всех задачах

Я попробовал PaddleOCR их демо- загружает картинку на бек Байду и занимает 3 секунды на распознавание. Самое точное, но бывает в 1 номере в коде ошибается.
PaddleJS демо- ну хз, не сказать, что прямо лучше чем Tesseract WASM демо. Та же самая картинка, paddle её не видит совсем, а tesseract видит, но гонит — много ошибок в коде.
У PaddleJS нахождение text box (когда он видит) сделано лучше: по 4 точкам линии. В то время, как тессеракт рисует большие параллелепипеды при наклоне текста.

У встроенной фото софтины Галакси Таб оказывается, тоже есть распознавание. Только нужно кликнуть на один из подсвеченных текст боксов, и оно копирует распознанный текст в буфер обмена. Оно схватило букву от другого слова и ошиблось в 1 номере в коде.

А что интересно есть такое, чтобы зацепить символы по отдельности и самому попытаться склеить их в слова? Как каждым отдельным символом "дотренировывать" CNN, если ошибка и он изменён пользователем?

От:	Артём	жж
Дата:	29.05.23 15:07
Оценка: