Re[2]: S3. Полнотекстовый поиск
От: BlackEric http://black-eric.lj.ru
Дата: 07.03.24 07:11
Оценка:
Здравствуйте, RushDevion, Вы писали:

RD>У Амазона есть Managed Elastic Search (старый) и OpenSearch (что-то поновее).

RD>Загружай в него и ищи стандартными средствами (elk .net client).
RD>Нужно только прикинуть, как по шардам это разложить и посчитать в какие мощности/деньги оно выльется.
RD>Ну и научиться plain текст из docx/pdf извлекать, но тут уж готовых библиотек полно.

RD>Другой вариант — на голых EC2 инстансах развернуть любой поисковый движок: Solr, Sphinx, ELK, Manticore, Typesense и т.п.


RD>Вот ещё можно почитать, как люди в Озоне поиск делали https://habr.com/ru/companies/ozontech/articles/667600/


У меня не амазон, а совместимое хранилище в закрытой корпоративной сети. Получается идея состоит в том, что бы просканировать хранилище и проиндексировать содержимое файлов сложив всё в OpenSearch (ELK)?
https://github.com/BlackEric001
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.