Посоветуйте OCR с API - .NET

Нужно написать приложение, которое смогло бы быстро распознавать текст по шаблону на большом количестве изображений (примерно одно изображение в секунду, текста — до 20 символов). В качестве шаблона может быть например бэйджик, который содержит имя, фамилию и должность. На входе в помещение может быть установлена видеокамера, каждую секунду захватывается картинка с нее, распознается бэйджик и заносится в систему.
В связи с этим разыскиваю OCR с открытым API. Желательно бесплатную, но это не обязательно.

Здравствуйте, Аноним, Вы писали:

А> В связи с этим разыскиваю OCR с открытым API. Желательно бесплатную, но это не обязательно.
Если нужно распознаввние с учетом пространственного расположения текста (бэйдж

) — то я бы посоветовал ABBYY FlexiCapture Engine.

Если же просто распознавание текста — то, подойдет любой OCR (тот же ABBYY FineReader Engine). Вопрос в скорости и качестве распознавания. Но здесь я бы вам посоветовал получить выборку типичных для вашей задачи изображений и погонять все библиотеки на ней. Боюсь, что с описанной задачей (распознавание очень мелкого текста на нечетком изображении да еще полученном под неким произвольным углом) справится мало кто.

Я не знаю исходной задачи, поэтому не могу советовать, но если в конечном счете она сводится к идентификации находящихся в помещении людей, я бы посоветовал посмотреть в сторону:
— RFID меток в бэйджах
— штрих-кодов на бэйджах

В общем, идеально будет, если вы максимально раскроете исходную задачу

Здравствуйте, Романов Михаил, Вы писали:

РМ>Здравствуйте, Аноним, Вы писали:

А>> В связи с этим разыскиваю OCR с открытым API. Желательно бесплатную, но это не обязательно.
РМ>Если нужно распознаввние с учетом пространственного расположения текста (бэйдж

) — то я бы посоветовал ABBYY FlexiCapture Engine.

РМ>Если же просто распознавание текста — то, подойдет любой OCR (тот же ABBYY FineReader Engine). Вопрос в скорости и качестве распознавания. Но здесь я бы вам посоветовал получить выборку типичных для вашей задачи изображений и погонять все библиотеки на ней. Боюсь, что с описанной задачей (распознавание очень мелкого текста на нечетком изображении да еще полученном под неким произвольным углом) справится мало кто.

РМ>Я не знаю исходной задачи, поэтому не могу советовать, но если в конечном счете она сводится к идентификации находящихся в помещении людей, я бы посоветовал посмотреть в сторону:
РМ>- RFID меток в бэйджах
РМ>- штрих-кодов на бэйджах

РМ>В общем, идеально будет, если вы максимально раскроете исходную задачу

Есть некое заведение и в него могут приходить люди из разных других фирм. В каждой фирме свои стандарты на бейджики и они их оформляют как хотят. Мои заказчики на это повлиять никак не могут. Соответственно заставить всех носить RFID или определенный штрих-код также не представляется возможным. Штрих-код также не подходит по причине того, то в систему нужно заносит именно те данные, которые может человек прочитать на бейджике (а не так, что штрих-код от Иванова, а написано, что Сидоров).
Все посетители проходят ворота и практически вплотную проходят через камеру (камера может быть HD, так что качество картинки должно быть хорошим). Нужно распознать бейджик по базе шаблонов бейджиков. В реальности это будет выглядеть так: если система не смогла распознать какой-то бейджик, мы смотрим какого формата этот бейджик, создаем для него шаблон и в следующий раз система его должна распознать.
В плане трудности согласен — задача очень непростая. Но ведь системы для распознавания номеров автомобилей как-то работают.
Может я не в том направлении копаю? Может для распознавания текста не видео не используется обычный OCR, а что-нибудь другое?

Здравствуйте, Аноним, Вы писали:

А> Штрих-код также не подходит по причине того, то в систему нужно заносит именно те данные, которые может человек прочитать на бейджике (а не так, что штрих-код от Иванова, а написано, что Сидоров).
В целом, эта задача похожа на то, что делаетABBYY Business Card Reader и подобные системы (т.е. распознавание визиток).
На сколько я представляю, это делается на базе механизмов, аналогичных распознаванию гибких форм (в терминологии ABBYY), т.е. смотрите на ABBYY FlexiCapture Engine или аналоги (но аналогов, которые бы поставлялись как SDK я не знаю, в основном подобные технологии идут в составе готовых приложений).
Однако, у вас тут не статическое изображение, а видео. К тому же, на картинке просто море всего (а не только документ, требующий распознавания).
Так что может быть там и правда лучше связать с поставщиками систем распознавания номеров (но опять-таки, там шаблон не в пример проще, причем, если система и ошибется — все равно есть оператор для проверки).

А> Может я не в том направлении копаю? Может для распознавания текста не видео не используется обычный OCR, а что-нибудь другое?
Увы не знаю.

А вам действительно нужен этот текст? Может проще вести базу лиц (а данные вбивать вручную — при первом прохождении человека)? По крайней мере технологии распознавания лиц сейчас развиваются...

В общем, нужна потребность — для чего читать бейдж? (Может и правда, проще договориться о RFID-ах ...)

	От:	Аноним
	Дата:	13.08.10 20:45
	Оценка:

От:	Романов Михаил	https://mihailromanov.wordpress.com/
Дата:	14.08.10 02:36
Оценка:	2 (1)

	От:	Аноним
	Дата:	14.08.10 08:32
	Оценка:

От:	Романов Михаил	https://mihailromanov.wordpress.com/
Дата:	14.08.10 09:32
Оценка: