Здравствуйте, Kaa, Вы писали:
Kaa>Crash — это к diskMETA? Или к задаче?
Во-первых, НУ ПРОСТО ОГРОМНОЕ СПАСИБО за предоставленную информацию!!!
Во-вторых, crash — безусловно к задаче
Kaa>Что касается самих движков для полнотекстового поиска, то открытых — вагон и тележка: clucene, mnogoSearch, ht//dig, ASPSeek.
В-третьих, действительно открытых движков вагон и тележка.
Отсюда может быть нескромный вопрос лентяя:
Уважаемый Kaa, не посоветуете ли Вы мне, с каким из указанных Вами движков мне лучше всего связаться?
Полнотекстовый поиск мне нужен под Windows 2000/XP, а сам движок желательно на C/C++.
Kaa>Ну, а поисковое ядро потом требуется снабдить дисковым транспортом. И все.
В-четвёртых, вопрос по терминологии:
Что понимается под "дисковым транспортом"?
Здравствуйте, _kip, Вы писали:
_>Отсюда может быть нескромный вопрос лентяя: _>Уважаемый Kaa, не посоветуете ли Вы мне, с каким из указанных Вами движков мне лучше всего связаться?
В этом вопросе особо не помогу. Мы пишем свой, поэтому особо вдаваться в подробности других не было ни желания, ни необходимости. Да и вредно это, между нами говоря.
Не советуют для поиска по русскому контенту ht//dig. Советуют ASPSeek, но как-то он меня не впечатлил. Я видел его на паре больших коммерческих сайтов — жуткий тормоз. Возможно, у них машина слабая, или нагрузка большая — не понять. Вообще — многие его советуют.
Не советовал бы mnogoSearch — привязан к MySQL, что есть не гуд.
Kaa>>Ну, а поисковое ядро потом требуется снабдить дисковым транспортом. И все. _>В-четвёртых, вопрос по терминологии: _>Что понимается под "дисковым транспортом"?
Ну, все перечисленные движки заточены для собирания исходных докуметов по HTTP. Некоторые умеют и с диска, но за всех не скажу. Дисковый транспорт — это механизм поднимания документов с диска и передачии их для индексирования собственно движку
Меня всё-таки не оставляет навязчивая идея использовать для этой цели MS Indexing Service.
Как Вы можете охарактеризовать этот самый сервис?
Вообще-то, в использовании MS Indexing Service мне мешает проблема индексирования OLE контейнеров.
Если Вы знакомы с этой проблемой, подскажите, пожалуйста, как быть.
У меня такие мысли на этот счёт:
или писать свой IFilter,
или каким-то (тоже пока непонятным) способом "натравливать" стандартные фильтры на stream'ы в контейнерах.