Проектирование PDF экстрактора
От: Oleg Vladimirov Россия  
Дата: 25.04.12 08:30
Оценка:
Не уверен что выбрал тот форум, если нет, то подскажите где можно попросить совета...

Задача: Разработать систему, автоматизированного разбора PDF документов.

Шаг 1: Создание шаблона документа — Пользователь загружает пример документа, размечает его, и сохраняет эту разметку как шаблон.
Шаг 2: Разбор документов на основе шаблона — Пользователь загружает документ, выбирает шаблон и получает экстрагированные данные.

Требования к реализации: Система должна быть реализована в виде веб приложения, загружающегося в браузер.

Вопрос: Как организовать работу пользователя с PDF документами в браузере?

Был бы рад получить любую полезную информацию, прямо или косвенно относящиеся к поставленной задаче: Java PDF фреймворки, аналоги, принципиальные проблемы в реализации, средства реализации клиентской части, в общем все что как-то сюда относится.

Есть предполагаемые решение:

1) Java applet — сомневаюсь,технология забытая, стоит ли?
2) Использование аналогов applet'оа — Какие есть и как из можно использовать? жду проблем с расширением функциональности...
3) Использование JS движка — есть ли что подобное, кто знает?
4) Самостоятельная реализация подобного вьювера — сильно глупая идея?

Возможно ли вообще реализовать это команде из 2х человек за 2-3 месяца?
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.