Посоветуйте OCR с API
От: Аноним  
Дата: 13.08.10 20:45
Оценка:
Нужно написать приложение, которое смогло бы быстро распознавать текст по шаблону на большом количестве изображений (примерно одно изображение в секунду, текста — до 20 символов). В качестве шаблона может быть например бэйджик, который содержит имя, фамилию и должность. На входе в помещение может быть установлена видеокамера, каждую секунду захватывается картинка с нее, распознается бэйджик и заносится в систему.
В связи с этим разыскиваю OCR с открытым API. Желательно бесплатную, но это не обязательно.
Re: Посоветуйте OCR с API
От: Романов Михаил Удмуртия https://mihailromanov.wordpress.com/
Дата: 14.08.10 02:36
Оценка: 2 (1)
Здравствуйте, Аноним, Вы писали:

А> В связи с этим разыскиваю OCR с открытым API. Желательно бесплатную, но это не обязательно.

Если нужно распознаввние с учетом пространственного расположения текста (бэйдж ) — то я бы посоветовал ABBYY FlexiCapture Engine.

Если же просто распознавание текста — то, подойдет любой OCR (тот же ABBYY FineReader Engine). Вопрос в скорости и качестве распознавания. Но здесь я бы вам посоветовал получить выборку типичных для вашей задачи изображений и погонять все библиотеки на ней. Боюсь, что с описанной задачей (распознавание очень мелкого текста на нечетком изображении да еще полученном под неким произвольным углом) справится мало кто.

Я не знаю исходной задачи, поэтому не могу советовать, но если в конечном счете она сводится к идентификации находящихся в помещении людей, я бы посоветовал посмотреть в сторону:
— RFID меток в бэйджах
— штрих-кодов на бэйджах

В общем, идеально будет, если вы максимально раскроете исходную задачу
Re[2]: Посоветуйте OCR с API
От: Аноним  
Дата: 14.08.10 08:32
Оценка:
Здравствуйте, Романов Михаил, Вы писали:

РМ>Здравствуйте, Аноним, Вы писали:


А>> В связи с этим разыскиваю OCR с открытым API. Желательно бесплатную, но это не обязательно.

РМ>Если нужно распознаввние с учетом пространственного расположения текста (бэйдж ) — то я бы посоветовал ABBYY FlexiCapture Engine.

РМ>Если же просто распознавание текста — то, подойдет любой OCR (тот же ABBYY FineReader Engine). Вопрос в скорости и качестве распознавания. Но здесь я бы вам посоветовал получить выборку типичных для вашей задачи изображений и погонять все библиотеки на ней. Боюсь, что с описанной задачей (распознавание очень мелкого текста на нечетком изображении да еще полученном под неким произвольным углом) справится мало кто.


РМ>Я не знаю исходной задачи, поэтому не могу советовать, но если в конечном счете она сводится к идентификации находящихся в помещении людей, я бы посоветовал посмотреть в сторону:

РМ>- RFID меток в бэйджах
РМ>- штрих-кодов на бэйджах

РМ>В общем, идеально будет, если вы максимально раскроете исходную задачу


Есть некое заведение и в него могут приходить люди из разных других фирм. В каждой фирме свои стандарты на бейджики и они их оформляют как хотят. Мои заказчики на это повлиять никак не могут. Соответственно заставить всех носить RFID или определенный штрих-код также не представляется возможным. Штрих-код также не подходит по причине того, то в систему нужно заносит именно те данные, которые может человек прочитать на бейджике (а не так, что штрих-код от Иванова, а написано, что Сидоров).
Все посетители проходят ворота и практически вплотную проходят через камеру (камера может быть HD, так что качество картинки должно быть хорошим). Нужно распознать бейджик по базе шаблонов бейджиков. В реальности это будет выглядеть так: если система не смогла распознать какой-то бейджик, мы смотрим какого формата этот бейджик, создаем для него шаблон и в следующий раз система его должна распознать.
В плане трудности согласен — задача очень непростая. Но ведь системы для распознавания номеров автомобилей как-то работают.
Может я не в том направлении копаю? Может для распознавания текста не видео не используется обычный OCR, а что-нибудь другое?
Re[3]: Посоветуйте OCR с API
От: Романов Михаил Удмуртия https://mihailromanov.wordpress.com/
Дата: 14.08.10 09:32
Оценка:
Здравствуйте, Аноним, Вы писали:

А> Штрих-код также не подходит по причине того, то в систему нужно заносит именно те данные, которые может человек прочитать на бейджике (а не так, что штрих-код от Иванова, а написано, что Сидоров).

В целом, эта задача похожа на то, что делаетABBYY Business Card Reader и подобные системы (т.е. распознавание визиток).
На сколько я представляю, это делается на базе механизмов, аналогичных распознаванию гибких форм (в терминологии ABBYY), т.е. смотрите на ABBYY FlexiCapture Engine или аналоги (но аналогов, которые бы поставлялись как SDK я не знаю, в основном подобные технологии идут в составе готовых приложений).
Однако, у вас тут не статическое изображение, а видео. К тому же, на картинке просто море всего (а не только документ, требующий распознавания).
Так что может быть там и правда лучше связать с поставщиками систем распознавания номеров (но опять-таки, там шаблон не в пример проще, причем, если система и ошибется — все равно есть оператор для проверки).

А> Может я не в том направлении копаю? Может для распознавания текста не видео не используется обычный OCR, а что-нибудь другое?

Увы не знаю.

А вам действительно нужен этот текст? Может проще вести базу лиц (а данные вбивать вручную — при первом прохождении человека)? По крайней мере технологии распознавания лиц сейчас развиваются...

В общем, нужна потребность — для чего читать бейдж? (Может и правда, проще договориться о RFID-ах ...)
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.