ANSI кодировки с более чем 2 байтами на символ
От: Sergey J. A. Беларусь  
Дата: 17.01.11 08:19
Оценка:
Существуют ли ANSI кодировки, в которых встречаются символы, кодируемые более 2 байтами.
Все кодировки, которые я просмотрел, используют 1 или 2 байта и не больше. Но может такие существуют?

Интересует применительно к WinAPI.
Re: ANSI кодировки с более чем 2 байтами на символ
От: hattab  
Дата: 17.01.11 09:05
Оценка: 4 (1)
Здравствуйте, Sergey J. A., Вы писали:

SJA> Существуют ли ANSI кодировки, в которых встречаются символы, кодируемые более 2 байтами.

SJA> Все кодировки, которые я просмотрел, используют 1 или 2 байта и не больше. Но может такие существуют?

SJA> Интересует применительно к WinAPI.


cp50220 — iso-2022-jp (Japanese (JIS)) — maxCharSize — 5 bytes
cp50221 — csISO2022JP (Japanese (JIS-Allow 1 byte Kana)) — maxCharSize — 5 bytes
cp50222 — iso-2022-jp (Japanese (JIS-Allow 1 byte Kana — SO/SI)) — maxcharSize — 5 bytes
cp50225 — iso-2022-kr (Korean (ISO)) — maxCharSize — 5 bytes
cp50227 — x-cp50227 (Chinese Simplified (ISO-2022)) — maxCharSize — 5 bytes
cp51932 — euc-jp (Japanese (EUC)) — maxCharSize — 3 bytes
cp52936 — hz-gb-2312 (Chinese Simplified (HZ)) — maxCharSize — 5 bytes
cp54936 — GB18030 (Chinese Simplified (GB18030)) — maxCharSize — 4 bytes
cp57002 — x-iscii-de (ISCII Devanagari) — maxCharSize — 4 bytes
cp57003 — x-iscii-be (ISCII Bengali) — maxCharSize — 4 bytes
cp57004 — x-iscii-ta (ISCII Tamil) — maxCharSize — 4 bytes
cp57005 — x-iscii-te (ISCII Telugu) — maxCharSize — 4 bytes
cp57006 — x-iscii-as (ISCII Assamese) — maxCharSize — 4 bytes
cp57007 — x-iscii-or (ISCII Oriya) — maxCharSize — 4 bytes
cp57008 — x-iscii-ka (ISCII Kannada) — maxcharSize — 4 bytes
cp57009 — x-iscii-ma (ISCII Malayalam) — maxCharSize — 4 bytes
cp57010 — x-iscii-gu (ISCII Gujarati) — maxCharSize — 4 bytes
cp57011 — x-iscii-pa (ISCII Punjabi) — maxCharSize — 4 bytes

Кажется все
avalon 1.0rc3 rev 380, zlib 1.2.3
Re[2]: ANSI кодировки с более чем 2 байтами на символ
От: Sergey J. A. Беларусь  
Дата: 17.01.11 09:11
Оценка:
Здравствуйте, hattab, Вы писали:

H>Кажется все


Спасибо. А откуда сведения, есть ссылка? Может я там ещё чего интересного для себя найду.
Re[3]: ANSI кодировки с более чем 2 байтами на символ
От: hattab  
Дата: 17.01.11 09:39
Оценка:
Здравствуйте, Sergey J. A., Вы писали:

SJA> Спасибо. А откуда сведения, есть ссылка? Может я там ещё чего интересного для себя найду.


Из PlatformSDK (Code Page Identifiers), а потом по каждой GetCPInfo.
avalon 1.0rc3 rev 380, zlib 1.2.3
Re[2]: ANSI кодировки с более чем 2 байтами на символ
От: Centaur Россия  
Дата: 18.01.11 19:15
Оценка:
Здравствуйте, hattab, Вы писали:

SJA>> Существуют ли ANSI кодировки, в которых встречаются символы, кодируемые более 2 байтами.


H>cp50220 — iso-2022-jp (Japanese (JIS)) — maxCharSize — 5 bytes

[…]
H>cp57011 — x-iscii-pa (ISCII Punjabi) — maxCharSize — 4 bytes

H>Кажется все


Да, и ни одна из них не входит в подмножество ANSI-кодировок. То есть перекодировать в/из них можно, а непосредственно использовать в *A-функциях Win32 API — нет.

См. также.
Re[3]: ANSI кодировки с более чем 2 байтами на символ
От: hattab  
Дата: 18.01.11 19:44
Оценка:
Здравствуйте, Centaur, Вы писали:

C> Да, и ни одна из них не входит в подмножество ANSI-кодировок. То есть перекодировать в/из них можно, а непосредственно использовать в *A-функциях Win32 API — нет.


C> См. также.


На юникодных виндах *A-функции делают перекодировку и перенаправляют вызов в юникод-аналог. С чем связана проблема (по ссылке ходил)?
avalon 1.0rc3 rev 380, zlib 1.2.3
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.