Помогите выбрать лучший вариант реализации модуля...
От: Аноним  
Дата: 01.06.11 15:57
Оценка:
Добрый день,

необходимо реализовать модуль поиска информации в текстовых документах для web-приложения. Документы имеют определенную структуру и кроме задачи непосредственно полнотекстового поиска необходимо уметь отдавать пользователю отдельные элементы струтктуры (например, только заголовки или только таблицы и пр).

Вопрос заключается в том, как лучше организовать работу с такими данными ?
Первоначальный вариант заключался в сохранении текста документа в БД (нпр, ***HSQL***, т.к. проект на Java и среди требований — использование in process database ) и сохранении структуры документов в БД со ссылками на текст. При этом встает вопрос поиска свободно распространяемой БД с модулем полнотекстового поиска (других вариантов организации полнотекствого поиска в БД не вижу).

Другой вариант — хранить документы отдельно от БД (нпр, в XML файлах), а в БД только струтктуру документа со ссылками на их положение в файле.

Совсем без БД обойтись нельзя — т.к. предполагается использование данного модуля в web-приложении (многопользовательском).

Не понятно какой из вариантов кошернее и как обычно решают эту, вообщем-то ординарную, задачу.

Спасибо
Re: Помогите выбрать лучший вариант реализации модуля...
От: Аноним  
Дата: 01.06.11 16:48
Оценка: +1
Apache Lucene смотрели? http://lucene.apache.org/

Вроде всё перечисленное там уже давно реализовано. К тому же на Java, как и просили.
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.