Re[20]: [performance] чего-то я не понимаю в этой жизни

Здравствуйте, Videoman, Вы писали:

V> R>Я для кого только что написал о нормализации?

V> При чем тут нормализация. Мы не собираемся реализовывать нечеткое сравнение строк. Все-равно куча символов будет состоять из нескольких кодпоинтов. Если бы весь UTF-16 можно было бы запихнуть в одно слово (UCS-2), то суррогатные пары были бы не нужны, точка.

При том, что при нормализации композицией не будет никаких раздвоенных "Ё".

V> R>В utf-16 вполне. После нормализации (еще раз). Не нужно несколько проверок на длину последовательности, не нужно проверок корректности последовательностей.

V> О каких проверка речь?

Посмотри в rfc utf-8, почитай о security considerations.

V> R>Нет, не пофиг. Просто это не самые используемые части unicode. Это к тому, что получить кодпоинт из сурроганой пары utf-16 это, мало того, что очень просто, так это еще и не придется делать очень часто. А вот в utf-8 с ее последовательностями... Ну ты понял.

V> Я понял одно, что ты теоретик, который рассуждает о том, с чем он на самом деле никогда не сталкивался и никогда не работал. Либо работал с UCS-2 и забил на всё остальное.

Жаль, что не понял. Ну да ладно.

avalon/3.0.0

	От:	rudzuk
	Дата:	03.07.22 12:32
	Оценка: