У Амазона есть Managed Elastic Search (старый) и OpenSearch (что-то поновее).
Загружай в него и ищи стандартными средствами (elk .net client).
Нужно только прикинуть, как по шардам это разложить и посчитать в какие мощности/деньги оно выльется.
Ну и научиться plain текст из docx/pdf извлекать, но тут уж готовых библиотек полно.
Другой вариант — на голых EC2 инстансах развернуть любой поисковый движок: Solr, Sphinx, ELK, Manticore, Typesense и т.п.
Вот ещё можно почитать, как люди в Озоне поиск делали
https://habr.com/ru/companies/ozontech/articles/667600/