Re[3]: многоликий Unicode

Здравствуйте, Аноним, Вы писали:

А>Это не так. UTF-7 — очень сцепифическая кодировка.

А>В отличие от UTF-8 и UTF-16, символам не сопоставлены однозначные последовательности байтов (слов).

А>Используется только некоторое подмножество кодов ASCII (не используются "~", "\", что-то еще — не помню). Исходное состояние потока таково: символы этого подмножества, кроме "+" представляют сами себя. Символ "+" переводит поток в состояние кодирования: последовательность символов из набора UCS-2 или UCS-4 представляется сперва в кодировке UTF-16 (возможно, с применением суррогатов), затем полученная последовательность байтов кодируется алгоритмом BASE64. Признак конца такой последовательности и перехода в исходное состояние — символ "-". Сочетание "+-" обозначает сам символ "+".

Ух ты ж елы палы! А я, не найдя документации по UTF-7, не смог самостоятельно догадаться, что это за чача.

	От:	Кодт
	Дата:	07.10.03 07:47
	Оценка: