Здравствуйте, Евгений Музыченко, Вы писали:
ЕМ>Здравствуйте, migel, Вы писали:
M>>Обычно хождение по Xref (вкладка справа) помогает — там и типы ссылок есть.
ЕМ>Хм, а это нормально, что в XREF сперва почти все позиции — "Indirect object", и только после прохода меняются на конкретные типы?
Это нормально (тм) так как ссылки не типизированы то тип можно определить только прочитав объект.
ЕМ>Изображения из потоков оно достает, а как опознать все остальное — текст, оформление?
Для этого нужно знать PostScript like язык ПДФ

— так как описывается программа стэковой машины отрисовки.
в краткости сначала идут аргументы а потом команда что с ними делать. Tj например рисует текст по заданным координатам.
В связи с тонкостями связки глифы шрифта — кодировка текста то сам текст увидеть глазками тоже вряд ли получиццо.
ЕМ>И как там увидеть, где на странице расположен конкретный элемент?
В каждой странице есть ссылка на ContentStream и уж его разбирать