Здравствуйте, icomp, Вы писали:
I>Здравствуйте, коллеги!
I>Нужен совет.
I>Есть база с документами pdf, doc, docx и т.д. (на SQLServer 2012)
I>По документам организован полнотекстовый поиск.
I>Соответственно, используется FileStream и прикручены фильтры: Adobe PDF IFilter и FilterPack64bit для документов офиса.
I>При запросе с помощью CONTAINS или FREETEXT я получаю список документов, содержащих искомую фразу или слово.
I>Вопрос вот в чем: а можно ли получить результаты поиска по аналогии с поисковыми системами, то есть, показывать выдержки из текста?
I>То есть, нужно в документе найти строку, которая содержит искомое слово.
I>Взять эту строку, прибавить предыдущую строку и последующую, и эти три строки показать пользователю в результатах запроса.
I>Как это сделать?
I>Может, есть какие-то готовые библиотеки или сервисы?
Одна из самых популярных опенсорс библиотек — Sphinx (
http://sphinxsearch.com/)
А ключевое слово для выдержек из текста применительно к Sphinx: "snippets"