Re[3]: Семантический поиск / Vector Index в каталоге
От: pva  
Дата: 10.03.26 09:42
Оценка:
Здравствуйте, Артём, Вы писали:

Аё>Я спрашиваю про другой юзкейс, а именно- дополнить или заменить олдскульный индекс по префиксу/суффиксу description на векторный индекс, чтобы если юзер произвольно сформулировал описание- оно всё равно по смыслу нашло.

Это не другой кейс, а часть того что я предложил. Если вкратце, то выше реализовано примерно следующее: заданные наборы данных токенизируются моделью и складываются в БД (угу, sqlite) а дальше запросы пользователя точно так же токенизируются и делается FTS, если его выхлопа не хватает, то сваливается в фолбек семантический (вероятно, просто косинусное подобие) + взвешивание. Смысл не просто в векторном подобии, а в токенизированном подобии, что должно улучшать поиск по синонимичным понятиям.
Если б не ленился, то глянул бы echovault\src\memory\search.py — там всего 100 строк. Остальное — просто обвязка для MCP/Tool.
newbie
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.