Re[3]: многоликий Unicode
От: Кодт Россия  
Дата: 07.10.03 07:47
Оценка:
Здравствуйте, Аноним, Вы писали:

А>Это не так. UTF-7 — очень сцепифическая кодировка.


А>В отличие от UTF-8 и UTF-16, символам не сопоставлены однозначные последовательности байтов (слов).


А>Используется только некоторое подмножество кодов ASCII (не используются "~", "\", что-то еще — не помню). Исходное состояние потока таково: символы этого подмножества, кроме "+" представляют сами себя. Символ "+" переводит поток в состояние кодирования: последовательность символов из набора UCS-2 или UCS-4 представляется сперва в кодировке UTF-16 (возможно, с применением суррогатов), затем полученная последовательность байтов кодируется алгоритмом BASE64. Признак конца такой последовательности и перехода в исходное состояние — символ "-". Сочетание "+-" обозначает сам символ "+".


Ух ты ж елы палы! А я, не найдя документации по UTF-7, не смог самостоятельно догадаться, что это за чача.
Перекуём баги на фичи!
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.