Как определить кодовую страницу по заданному charset?
От:
Аноним
Дата:
13.08.07 11:07
Оценка:
HTML код сожержит тэг <META>, который может задавать кодировку html страницы. Эта же информация будет содержатчя в HTTP заголовке:
Content-Type: text/html; charset=windows-1251
Как определить номер кодовой страницы по кодеровки, заданной в тэги <META> или в HTTP заголовке?
Пробовал делать через EnumSystemCodePages и GetCPInfoEx, но GetCPInfoEx возвращает имя кодовой страницы в другом формате. Например для кодировки windows-1251, GetCPInfoEx возвращает имя: 1251 (ANSI — Cyrillic). Поэтому я немогу пробегая по всем системным кодовым страницам с помощью EnumSystemCodePages сравнить charset из HTTP заголовка с тем именем, которое выдает GetCPInfoEx, и определить является ли текущая кодовая страница той, которая указана в charset'е.
В приведенном примере charset содержит номер кодовой страницы, откуда его можно извлеч. Есть ли гарантия, что charset для других кодировок будет содержать номер кодовой страницы?