K1llMan <95731@users.rsdn.ru> писал(а) в своём письме Thu, 03 Feb 2011
18:19:08 +0300:
> Имеется несколько десятков PDF-файлов, структура текста которых
> одинакова. Требуется извлечь текст и таблицы, сохранив структуру
> исходного документа для последующего размещения в БД.
Только каким-нибудь ABBYY PDF Reader. Потому как PDF — это напечатанный
текст. Нормально извлечь из него структуру документа не выйдет. Только
распознавать...
Posted via RSDN NNTP Server 2.1 beta