Re[2]: Как распарсить PDF?

Здравствуйте, garant, Вы писали:

G>Только каким-нибудь ABBYY PDF Reader. Потому как PDF — это напечатанный
G>текст. Нормально извлечь из него структуру документа не выйдет. Только
G>распознавать...

Вообще-то PDF предусматривает наличие неотображаемого текстового слоя, чтобы можно было искать текст по документу, копировать в буфер и т.д. Другое дело, что этот слой необязательный.

Переместить
Удалить
Выделить ветку

Пока на собственное сообщение не было ответов, его можно удалить.

От:	ДимДимыч	http://klug.org.ua
Дата:	05.02.11 12:32
Оценка: