Re[20]: [performance] чего-то я не понимаю в этой жизни
От: rudzuk  
Дата: 03.07.22 12:32
Оценка:
Здравствуйте, Videoman, Вы писали:

V> R>Я для кого только что написал о нормализации?


V> При чем тут нормализация. Мы не собираемся реализовывать нечеткое сравнение строк. Все-равно куча символов будет состоять из нескольких кодпоинтов. Если бы весь UTF-16 можно было бы запихнуть в одно слово (UCS-2), то суррогатные пары были бы не нужны, точка.


При том, что при нормализации композицией не будет никаких раздвоенных "Ё".

V> R>В utf-16 вполне. После нормализации (еще раз). Не нужно несколько проверок на длину последовательности, не нужно проверок корректности последовательностей.


V> О каких проверка речь?


Посмотри в rfc utf-8, почитай о security considerations.

V> R>Нет, не пофиг. Просто это не самые используемые части unicode. Это к тому, что получить кодпоинт из сурроганой пары utf-16 это, мало того, что очень просто, так это еще и не придется делать очень часто. А вот в utf-8 с ее последовательностями... Ну ты понял.


V> Я понял одно, что ты теоретик, который рассуждает о том, с чем он на самом деле никогда не сталкивался и никогда не работал. Либо работал с UCS-2 и забил на всё остальное.


Жаль, что не понял. Ну да ладно.
avalon/3.0.0
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.