Здравствуйте, RushDevion, Вы писали:
RD>У Амазона есть Managed Elastic Search (старый) и OpenSearch (что-то поновее).
RD>Загружай в него и ищи стандартными средствами (elk .net client).
RD>Нужно только прикинуть, как по шардам это разложить и посчитать в какие мощности/деньги оно выльется.
RD>Ну и научиться plain текст из docx/pdf извлекать, но тут уж готовых библиотек полно.
RD>Другой вариант — на голых EC2 инстансах развернуть любой поисковый движок: Solr, Sphinx, ELK, Manticore, Typesense и т.п.
RD>Вот ещё можно почитать, как люди в Озоне поиск делали https://habr.com/ru/companies/ozontech/articles/667600/
У меня не амазон, а совместимое хранилище в закрытой корпоративной сети. Получается идея состоит в том, что бы просканировать хранилище и проиндексировать содержимое файлов сложив всё в OpenSearch (ELK)?