Re[2]: S3. Полнотекстовый поиск

Здравствуйте, RushDevion, Вы писали:

RD>У Амазона есть Managed Elastic Search (старый) и OpenSearch (что-то поновее).
RD>Загружай в него и ищи стандартными средствами (elk .net client).
RD>Нужно только прикинуть, как по шардам это разложить и посчитать в какие мощности/деньги оно выльется.
RD>Ну и научиться plain текст из docx/pdf извлекать, но тут уж готовых библиотек полно.

RD>Другой вариант — на голых EC2 инстансах развернуть любой поисковый движок: Solr, Sphinx, ELK, Manticore, Typesense и т.п.

RD>Вот ещё можно почитать, как люди в Озоне поиск делали https://habr.com/ru/companies/ozontech/articles/667600/

У меня не амазон, а совместимое хранилище в закрытой корпоративной сети. Получается идея состоит в том, что бы просканировать хранилище и проиндексировать содержимое файлов сложив всё в OpenSearch (ELK)?

От:	BlackEric	http://black-eric.lj.ru
Дата:	07.03.24 07:11
Оценка: