Не нашел более подходящего раздела, поэтому сюда.
Задача следующая — есть много пдф файлов с однотипным рекламным баннером на первой странице. Нужно автоматически удалить все эти банеры. Как это проще всего сделать? Открыт ли формат пдф или единственный способ — найти бинарный кусок, соответствующий рекламе и потом удалить его из всех файлов?
это Вам в http://www.adobe.com/devnet/acrobat/ . Открывает, позволяет модифицировать записывать PDF-ы. Лучше всего найдите того, кто это делал или умеет делать — дешевле будет.
Здравствуйте, MiryMir, Вы писали:
MM> Не нашел более подходящего раздела, поэтому сюда. MM> Задача следующая — есть много пдф файлов с однотипным рекламным баннером на первой странице. Нужно автоматически удалить все эти банеры. Как это проще всего сделать? Открыт ли формат пдф или единственный способ — найти бинарный кусок, соответствующий рекламе и потом удалить его из всех файлов?
MM> Не нашел более подходящего раздела, поэтому сюда. MM> Задача следующая — есть много пдф файлов с однотипным рекламным баннером на первой странице. Нужно автоматически удалить все эти банеры. Как это проще всего сделать? Открыт ли формат пдф или единственный способ — найти бинарный кусок, соответствующий рекламе и потом удалить его из всех файлов?
Здравствуйте, Anatoliy.Sviridenkov, Вы писали:
AS>Здравствуйте, MiryMir, Вы писали:
MM>> Не нашел более подходящего раздела, поэтому сюда. MM>> Задача следующая — есть много пдф файлов с однотипным рекламным баннером на первой странице. Нужно автоматически удалить все эти банеры. Как это проще всего сделать? Открыт ли формат пдф или единственный способ — найти бинарный кусок, соответствующий рекламе и потом удалить его из всех файлов?
AS>pdflib
Он платный зараза. Что-нибудь freeware не подскажете?
Здравствуйте, LtSolo, Вы писали:
LS> Здрасте,
LS> это Вам в http://www.adobe.com/devnet/acrobat/ . Открывает, позволяет модифицировать записывать PDF-ы. Лучше всего найдите того, кто это делал или умеет делать — дешевле будет.
LS>Здравствуйте, MiryMir, Вы писали:
Дешевле, чем что?)))
А по теме — вы не в курсе случайно, где искать такого человека и сколько примерно это будет стоить?
MM> Не нашел более подходящего раздела, поэтому сюда. MM> Задача следующая — есть много пдф файлов с однотипным рекламным баннером на первой странице. Нужно автоматически удалить все эти банеры. Как это проще всего сделать? Открыт ли формат пдф или единственный способ — найти бинарный кусок, соответствующий рекламе и потом удалить его из всех файлов?
Кстати, тут появилась идея, конвертить сначала пдф в битмап, потом тупо вырезать рекламу из битмапа(для однотипной рекламы это не сложно), а потом конвертить обратно в пдф. Но я вот поискал софт pdf2bmp и нашел только платный. Может кто знает бесплатные библиотеки?
Дешевле, чем учиться самому, разрабатывать, отлаживать и наступать на все мыслимые грабли с COS объектами в PDF. Для знающего человека — задача часов на 12-16 ($500).
Где искать таких... даже и не знаю. Наверна проще всего найти в резюме на каком-нить jobs.XXXXX.ru .
Здравствуйте, MiryMir, Вы писали:
MM>Здравствуйте, LtSolo, Вы писали:
LS>> Здрасте,
LS>> это Вам в http://www.adobe.com/devnet/acrobat/ . Открывает, позволяет модифицировать записывать PDF-ы. Лучше всего найдите того, кто это делал или умеет делать — дешевле будет.
LS>>Здравствуйте, MiryMir, Вы писали:
MM>Дешевле, чем что?))) MM>А по теме — вы не в курсе случайно, где искать такого человека и сколько примерно это будет стоить?
Здравствуйте, MiryMir, Вы писали:
MM>> Не нашел более подходящего раздела, поэтому сюда. MM>> Задача следующая — есть много пдф файлов с однотипным рекламным баннером на первой странице. Нужно автоматически удалить все эти банеры. Как это проще всего сделать? Открыт ли формат пдф или единственный способ — найти бинарный кусок, соответствующий рекламе и потом удалить его из всех файлов?
MM>Кстати, тут появилась идея, конвертить сначала пдф в битмап, потом тупо вырезать рекламу из битмапа(для однотипной рекламы это не сложно), а потом конвертить обратно в пдф. Но я вот поискал софт pdf2bmp и нашел только платный. Может кто знает бесплатные библиотеки?
Скорее всего, все много проще. Очень вероятно, что рекламный баннер будет представлен в виде отдельного стрима. Поэтому разбираться с представлением самих стримов скорее всего не придется. Ну а написать прогу, которая пробежится по всем стримам и выкинет нафиг нужный можно за день. Собственно стрим даже не обязательно убирать из файла, достаточно просто пометить в каталоге как удаленный. То есть вся задача — считать каталог из pdf, распарсить и приписать в конец новую версию.