Re[3]: SoundEx для опечаток
От: Vadim M  
Дата: 04.12.08 05:13
Оценка: 18 (1)
Здравствуйте, Igor Sukhov, Вы писали:

IS>Здравствуйте, z00n, Вы писали:


IS>>>Как называются семейство алгоритмов типа того что Google использует для исправления потенциальных опечаток в поисковых фразах.


IS>Хотелось чтобы алгоритм был умным и понимал такое как:


IS>*пользователь напеча часть идентификатора

IS>*пользователь напеМатал не ту букву (и более чем одну)
IS>*пользователь напеЧЧЧаталЛ букву несколько раз.
IS>*пользователь пропстил букву
IS>и их комбинации и еще чтото.

IS>кажется такое есть в IPhone.


IS>В общем нужна т-я ф-я которая переводит базу слов в базу каких нить значений и

IS>далее мы берем ввод пользователя, вычисляем значение ф-и для этого ввода и
IS>сравниваем с уже имеющимся.

IS>вопрос — какая это должна быть ф-я?


Метрика Левенштейна. Другое название для нее "дистанция редактирования" (edit distance)
Но п.1 (про часть идентификатора) нужно реализовывать самому
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.