Допустим есть две текстовые строки введенные человеком. В каждой из строк возмножны разнообразные ошибки: пропуск букв, неправильно напечатанная буква, перестановки и пр. Как можно определить (конечно с определенной погрешностью), что эти две строки являются попыткой ввода одной и той же строки?
То есть, скажем qwerty,wqrty и qwerty,qsedft. Очевидно, что в первом случае вероятность того, что это одна и та же строка гораздо выше.