Re[2]: Как распарсить PDF?
От: ДимДимыч Украина http://klug.org.ua
Дата: 05.02.11 12:32
Оценка:
Здравствуйте, garant, Вы писали:

G>Только каким-нибудь ABBYY PDF Reader. Потому как PDF — это напечатанный

G>текст. Нормально извлечь из него структуру документа не выйдет. Только
G>распознавать...

Вообще-то PDF предусматривает наличие неотображаемого текстового слоя, чтобы можно было искать текст по документу, копировать в буфер и т.д. Другое дело, что этот слой необязательный.
Обязательно бахнем! И не раз. Весь мир в труху! Но потом. (ДМБ)
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.