Народ, подскажите зачем в стандарте UTF-8 выбрали такой причцдливый способ кодирования байтов:
0XXXXXXX - для символа длинной однин байта
110XXXXX 10XXXXXX - для символа длинной два байта
1110XXXX 10XXXXXX 10XXXXXX - для символа длинной три байта
11110XXX 10XXXXXX 10XXXXXX 10XXXXXX - для символа длинной четыре байта
111110XX 10XXXXXX 10XXXXXX 10XXXXXX 10XXXXXX - для символа длинной пять байт
1111110X 10XXXXXX 10XXXXXX 10XXXXXX 10XXXXXX 10XXXXXX - для символа длинной шесть байт
08.03.11 12:56: Перенесено модератором из '.NET' — TK