Re[4]: Нечеткое сравнение слов.
От: vdimas Россия  
Дата: 18.10.25 14:19
Оценка:
Здравствуйте, bnk, Вы писали:

bnk>Насколько я понял там формально доказано что удаления эквивалентны опечаткам, поэтому это и работает


Удаления эквивалентны опечаткам-заменам, разумеется.

Но для опечаток-перестановок (поменяли соседние символы местами) расстояние между словами считается 1, но SymSpell для этого случая требует 2 удаления, т.е. рассматривает этот вид опечаток как расстояние 2. ))

И для опечаток, когда добавлен случайно лишний символ, он на каждый добавленный символ уменьшает покрываемое расстояние других опечаток на 1.

====
Однако, SymSpell относительно дешево позволяет сделать не 2 опечатки, а 3, что покрывает функциональность других алгоритмов с порогом расстояния 2, для тех ситуаций, где встречается не более одной опечатки-добавления.

В целом подход оччень неплох...
Отредактировано 18.10.2025 14:20 vdimas . Предыдущая версия . Еще …
Отредактировано 18.10.2025 14:20 vdimas . Предыдущая версия .
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.