MSXML parser and how to determine the encoding of content ?
От: Аноним  
Дата: 24.04.08 17:38
Оценка:
Суть проблемы: разрабатывается ISAPI — filter, который умеет парсать SOAP — content HTTP — запросов и неким образом патчить контент (такой вот хак нужен заказчику ). И всебы отлично, но для правильного пропатчивания нужно знать кодировку, в которой пришел контент. Сейчас кодировка узнается либо из контента путем поиска BOM (Byte-Order-Mark), либо из XML — declaration (<?xml version="1.0" encoding="utf-8"?>) или из элемента charset HTTP — header'а (Content-Type: text/html; charset=Windows-1251).
Как мне кажется, это очень кривой способ узнать кодировку, к томуже он невсегда работает.
Собственно вопрос: КАК SAX — parser вычисляет кодировку если нет XML — declaration и неопределен BOM???

26.04.08 22:32: Перенесено модератором из 'C/C++. Прикладные вопросы' — Кодт
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.