Re[3]: Семантический поиск / Vector Index в каталоге

Здравствуйте, Артём, Вы писали:

Аё>Я спрашиваю про другой юзкейс, а именно- дополнить или заменить олдскульный индекс по префиксу/суффиксу description на векторный индекс, чтобы если юзер произвольно сформулировал описание- оно всё равно по смыслу нашло.
Это не другой кейс, а часть того что я предложил. Если вкратце, то выше реализовано примерно следующее: заданные наборы данных токенизируются моделью и складываются в БД (угу, sqlite) а дальше запросы пользователя точно так же токенизируются и делается FTS, если его выхлопа не хватает, то сваливается в фолбек семантический (вероятно, просто косинусное подобие) + взвешивание. Смысл не просто в векторном подобии, а в токенизированном подобии, что должно улучшать поиск по синонимичным понятиям.
Если б не ленился, то глянул бы echovault\src\memory\search.py — там всего 100 строк. Остальное — просто обвязка для MCP/Tool.

	От:	pva
	Дата:	10.03.26 09:42
	Оценка: