Нужно найти решение.
Проблемой для нас стало найти WYSIWYG-редактор, который загружал бы PDF для редактирования. Помогите решить проблему, возможно мы вообще зря взяли за основу готовые редакторы.
Проблема, которую нужно решить – возможность редактирования текста к печати онлайн.
Процесс должен выглядеть примерно так: загрузка текста в разнообразных форматах, открытие его в оригинальном виде, либо подогнанном под нужный шаблон, редактирование, сохранение в PDF
Требования:
— загрузка текста в формате PDF, doc, docx, xml
— при открытии желательно чтобы типографика текста не меняется (включая расположение картинок и таблиц)
— импорт новых картинок
— после редактирования, текст должен быть сохранен в текстовом (векторном) PDF, для отправки на печать
— возможность использовать шаблоны верстки текста
Скорее всего речь идет о перегонке PDF в HTML. Есть ли готовые решения или можно их допилить?
Здравствуйте, Danbog, Вы писали:
D>Скорее всего речь идет о перегонке PDF в HTML. Есть ли готовые решения или можно их допилить?
Не скорее всего, а точно. Вам не редактор нужен, а конвертер pdf-html-pdf на сервере.
А с html любой редактор работать сможет.
Здравствуйте, Danbog, Вы писали:
D>Нужно найти решение. D>Проблемой для нас стало найти WYSIWYG-редактор, который загружал бы PDF для редактирования. Помогите решить проблему, возможно мы вообще зря взяли за основу готовые редакторы.
Нет такого редактора в природе и быть не может.
PDF файл это последовательность команд для печати. Т.е. это не документ содержащий некие семантические конструкции типа "Заголовок", "Параграф" и т.д. Нет там такого в принципе. Но есть нечто типа "Вывести символы ABC в позицию X,Y на странице Z".
Здравствуйте, c-smile, Вы писали:
CS>Здравствуйте, Danbog, Вы писали:
D>>Нужно найти решение. D>>Проблемой для нас стало найти WYSIWYG-редактор, который загружал бы PDF для редактирования. Помогите решить проблему, возможно мы вообще зря взяли за основу готовые редакторы.
CS>Нет такого редактора в природе и быть не может.
CS>PDF файл это последовательность команд для печати. Т.е. это не документ содержащий некие семантические конструкции типа "Заголовок", "Параграф" и т.д. Нет там такого в принципе. Но есть нечто типа "Вывести символы ABC в позицию X,Y на странице Z".
Здравствуйте, anonymous, Вы писали:
A>Здравствуйте, Danbog, Вы писали:
D>>А если перевести в HTML и потом назад в PDF?
A>Это можно.
Можно что? Восстановить семантическую структуру исходного документа?
Скажем некий word.doc был *напечатан* в PDF, а потом ты говоришь что можно из этого PDF внезапно восстановить редактируемый HTML?
Здравствуйте, c-smile, Вы писали:
CS>Можно что? Восстановить семантическую структуру исходного документа? Скажем некий word.doc был *напечатан* в PDF, а потом ты говоришь что можно из этого PDF внезапно восстановить редактируемый HTML?
CS>>Можно что? Восстановить семантическую структуру исходного документа? Скажем некий word.doc был *напечатан* в PDF, а потом ты говоришь что можно из этого PDF внезапно восстановить редактируемый HTML?
A>Да, есть утилиты типа pdf2html.
Я не зря сказал "редактируемый HTML".
pdf2html генерирует *набор* документов. Один html для каждой страницы. Каждый такой HTML содержит набор absolute positioned divs.
Как это преполагается WYSIWYG редактирвать? А pagination и все с этим связанное?
И я еще молчу про то что PDF->HTML это всегда loosing conversion.
Еще как-то можно себе представить редактир типа google docs который хоть и работает в browser, но не использует HTML DOM для представления документа — набор все тех же absolute positioned divs. Но таких редакторов которые делают WYSIWYG редактирование paged documents я знаю всего три и все они самостоятельные монструозные web applications и никак не встраиваемые компоненты.
Встраиваемыми являются редакторы основаные на @contenteditable (fckeditor со товарищи), но они требуют именно HTML DOM для документа. Редактирвать в них что-нибудь из под выхлопа pdf2html, а тем более конвертирвать обратно в PDF... "Оставь надежду всяк сюда входящий".
CS>>>Можно что? Восстановить семантическую структуру исходного документа? Скажем некий word.doc был *напечатан* в PDF, а потом ты говоришь что можно из этого PDF внезапно восстановить редактируемый HTML?
A>>Да, есть утилиты типа pdf2html.
CS>Я не зря сказал "редактируемый HTML".
CS>pdf2html генерирует *набор* документов. Один html для каждой страницы. Каждый такой HTML содержит набор absolute positioned divs. CS>Как это преполагается WYSIWYG редактирвать? А pagination и все с этим связанное? CS>И я еще молчу про то что PDF->HTML это всегда loosing conversion.
CS>Еще как-то можно себе представить редактир типа google docs который хоть и работает в browser, но не использует HTML DOM для представления документа — набор все тех же absolute positioned divs. Но таких редакторов которые делают WYSIWYG редактирование paged documents я знаю всего три и все они самостоятельные монструозные web applications и никак не встраиваемые компоненты.
CS>Встраиваемыми являются редакторы основаные на @contenteditable (fckeditor со товарищи), но они требуют именно HTML DOM для документа. Редактирвать в них что-нибудь из под выхлопа pdf2html, а тем более конвертирвать обратно в PDF... "Оставь надежду всяк сюда входящий".
Так какой Вы видите вариант для редактирования ПДФ файлов к печати в онлайне?
Здравствуйте, Danbog, Вы писали:
D>Так какой Вы видите вариант для редактирования ПДФ файлов к печати в онлайне?
Что б взять вот так открыть PDF файл, чего-то изменить и сохранить как PDF так никакого.
Нет такого в природе. Ни online ни как desktop приложение. По определению PDF как я уже сказал.
Редактировать можно документы, т.е. некие файлы хранящие семантическую DOM структуру.
Например .html, .doc и пр. А вот их уже можно печатать, в том числе и в PDF/postscript.
Можно еще пойти по пути Apache FOP если задача позволяет.
On 09.06.2013 02:06, Danbog wrote:
> Так какой Вы видите вариант для редактирования ПДФ файлов к печати в > онлайне?
Никакой, это нерешаемая в принципе задача. Но — с некоторыми
ограничениями можно менять кое-что в готовом ПДФ, если известно где оно
лежит.
Например — у вас есть документ, в котором написано "Домодедово", а вам
надо это поменять на "Шереметьево" (т.е. простой find/replace). Есть
инструменты (например itext) которые позволят в ряде случаев сделать
такую замену, и то наверняка найдётся такой PDF на котором эта
технология обломится.