Re[8]: Чем просмотреть структуру PDF?
От: migel  
Дата: 31.08.22 14:12
Оценка: 12 (1)
Здравствуйте, Евгений Музыченко, Вы писали:

ЕМ>Здравствуйте, migel, Вы писали:


M>>Обычно хождение по Xref (вкладка справа) помогает — там и типы ссылок есть.


ЕМ>Хм, а это нормально, что в XREF сперва почти все позиции — "Indirect object", и только после прохода меняются на конкретные типы?

Это нормально (тм) так как ссылки не типизированы то тип можно определить только прочитав объект.

ЕМ>Изображения из потоков оно достает, а как опознать все остальное — текст, оформление?


Для этого нужно знать PostScript like язык ПДФ — так как описывается программа стэковой машины отрисовки.
в краткости сначала идут аргументы а потом команда что с ними делать. Tj например рисует текст по заданным координатам.
В связи с тонкостями связки глифы шрифта — кодировка текста то сам текст увидеть глазками тоже вряд ли получиццо.

ЕМ>И как там увидеть, где на странице расположен конкретный элемент?

В каждой странице есть ссылка на ContentStream и уж его разбирать
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.