Кодировка байтов UTF-8 ?
От: Cynic Россия  
Дата: 06.03.11 11:03
Оценка:
Народ, подскажите зачем в стандарте UTF-8 выбрали такой причцдливый способ кодирования байтов:
0XXXXXXX - для символа длинной однин байта
110XXXXX 10XXXXXX - для символа длинной два байта
1110XXXX 10XXXXXX 10XXXXXX - для символа длинной три байта
11110XXX 10XXXXXX 10XXXXXX 10XXXXXX - для символа длинной четыре байта
111110XX 10XXXXXX 10XXXXXX 10XXXXXX 10XXXXXX - для символа длинной пять байт
1111110X 10XXXXXX 10XXXXXX 10XXXXXX 10XXXXXX 10XXXXXX - для символа длинной шесть байт



08.03.11 12:56: Перенесено модератором из '.NET' — TK
:)
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.