Re: "Мягкое" сравнение строк
От: vdttf  
Дата: 09.09.09 09:20
Оценка:
Здравствуйте, 8086, Вы писали:

8>Допустим есть две текстовые строки введенные человеком. В каждой из строк возмножны разнообразные ошибки: пропуск букв, неправильно напечатанная буква, перестановки и пр. Как можно определить (конечно с определенной погрешностью), что эти две строки являются попыткой ввода одной и той же строки?


8>То есть, скажем qwerty,wqrty и qwerty,qsedft. Очевидно, что в первом случае вероятность того, что это одна и та же строка гораздо выше.


Думаю можно посмотреть триграмы и суффиксные деревья, на их основе сделана орфография в nigma.ru
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.