Full-text search in .NET
От: HaPK Россия  
Дата: 24.01.05 07:49
Оценка:
Может кто сталкивался: в памяти есть текстовые данные, надо организовать full-text search по ним.
Есть ли какие-нибудь готовые open-source решения / алгоритмы / подходы ?
Re: Full-text search in .NET
От: Аноним  
Дата: 24.01.05 07:53
Оценка:
Сдесь есть кое-что:
http://algolist.manual.ru/search/fsearch/index.php
Re[2]: Full-text search in .NET
От: HaPK Россия  
Дата: 24.01.05 08:14
Оценка:
Здравствуйте, Аноним, Вы писали:

А>Сдесь есть кое-что:

А>http://algolist.manual.ru/search/fsearch/index.php

У меня немного другая задача, ежели нечеткий поиск.
Мне надо найти "документы", в которых встречаются заданные ключевые слова. В идеале — еще и отсортировать по релевантности.
Re[3]: Full-text search in .NET
От: Vlass  
Дата: 24.01.05 09:45
Оценка:
Попробуй MS Indexing Service, вещь достаточно простая и рабочая (пробовал в трех разных проектах) если что не поймешь спрашивай
Re[4]: Full-text search in .NET
От: HaPK Россия  
Дата: 24.01.05 09:57
Оценка:
Здравствуйте, Vlass, Вы писали:

V>Попробуй MS Indexing Service, вещь достаточно простая и рабочая (пробовал в трех разных проектах) если что не поймешь спрашивай

Дело в том, что:
1. У меня все данные хранятся в памяти.
2. Мне нужен функционал поиска на клиентских машинах (куда будет разворачиваться моя программа).

База сравнительно небольшая, поэтому я думаю реализовать индексирование текстовых данных руками. Просто подумал, может кто-то знает / видел / делал что-то подобное.

Я думаю для каждого слова сделать список всех документов, в котором оно встречается. Потом делать объединение / пересечение списков, если поиск ведется по нескольким словам. Там же можно и релевантность определять (подсчитывать вес каждого документа).
Re[5]: Full-text search in .NET
От: Dr.Gigabit  
Дата: 24.01.05 11:25
Оценка:
Здравствуйте, HaPK, Вы писали:

HPK>Я думаю для каждого слова сделать список всех документов, в котором оно встречается. Потом делать объединение / пересечение списков, если поиск ведется по нескольким словам. Там же можно и релевантность определять (подсчитывать вес каждого документа).


Правильной дорогой идете, товарищи Посмотрите здесь
Еще в гугле можно поискать по запросу "инвертированные файлы".


HPK>База сравнительно небольшая, поэтому я думаю реализовать индексирование текстовых данных руками. Просто подумал, может кто-то знает / видел / делал что-то подобное.


Делать-то делал, только все равно алгоритмы придется "затачивать" под конкретные задачи. Универсальный вариант — инвертированные файлы. Если база небольшая — проблем быть не должно.

Если появятся какие-то вопросы — пишите лучше на e-mail. Я этим вопросом занимался одно время достаточноо плотно, кое-какие наработки есть.
... << RSDN@Home 1.1.4 @@subversion >>
Re: Full-text search in .NET
От: AlexZu Россия  
Дата: 24.01.05 12:01
Оценка:
Здравствуйте, HaPK, Вы писали:

HPK>Может кто сталкивался: в памяти есть текстовые данные, надо организовать full-text search по ним.

HPK>Есть ли какие-нибудь готовые open-source решения / алгоритмы / подходы ?

Возможно то, что вам нужно:
http://www.lucenedotnet.com (порт http://jakarta.apache.org/lucene)
Re[2]: Full-text search in .NET
От: HaPK Россия  
Дата: 24.01.05 13:55
Оценка:
Здравствуйте, AlexZu, Вы писали:

AZ>Здравствуйте, HaPK, Вы писали:


HPK>>Может кто сталкивался: в памяти есть текстовые данные, надо организовать full-text search по ним.

HPK>>Есть ли какие-нибудь готовые open-source решения / алгоритмы / подходы ?

AZ>Возможно то, что вам нужно:

AZ>http://www.lucenedotnet.com (порт http://jakarta.apache.org/lucene)

Очень аппетитная вещь, но одна проблема — платная...
Re[3]: Full-text search in .NET
От: AlexZu Россия  
Дата: 24.01.05 14:21
Оценка: +1
Здравствуйте, HaPK, Вы писали:

AZ>>Возможно то, что вам нужно:

AZ>>http://www.lucenedotnet.com (порт http://jakarta.apache.org/lucene)

HPK>Очень аппетитная вещь, но одна проблема — платная...

Тады вот:
DotLucene &mdash; The Open Source Search Engine for .NET
Re[4]: Full-text search in .NET
От: HaPK Россия  
Дата: 24.01.05 14:31
Оценка:
Здравствуйте, AlexZu, Вы писали:

AZ>Здравствуйте, HaPK, Вы писали:


AZ>>>Возможно то, что вам нужно:

AZ>>>http://www.lucenedotnet.com (порт http://jakarta.apache.org/lucene)

HPK>>Очень аппетитная вещь, но одна проблема — платная...

AZ>Тады вот:
AZ>DotLucene &mdash; The Open Source Search Engine for .NET
Уже нашел! Спасибо
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.