Некорректно раскодируется XML в UTF-8 (+)
От: sergunok  
Дата: 11.07.05 22:50
Оценка:
Здравствуйте!

Проблема в следующем.


Я получаю XML-документ от внешней системы.

Затем распарсиваю его с использованием XmlDocument из .NET Framework.

Почему-то оказывается, что значения элементов, содержащие
русские тексты некорректно раскодируются.

Проведя небольшое исследование я обнаружил, что
в исходном документе некое русское слово выглядит в HEX как-то так:
C3 87 C3 93 C3 81 C3 97 C3 80 C3 92 C3 9B C3 89.
Русские слова в исходном документе некорректно отображаются в IE.

А русские слова в документах, которые я создаю САМ в тестовом проекте с использованием
XmlDocument.Save(), выяглядят как-то так (это другое слово, кажется "Вася"):
D0 92 D0 B0 D1 81 D1 BF. Эти документы корректно отображаются IE и при чтении тоже все ok.

Налицо то, что в тех документах, которые я получаю от другой системы
в русских словах используется дополнительный байт C3, а в том, с чем
оперирует .NET — D0 и D1.

Но проблема в том, что мне необходимо работать именно с теми документами, которые
оттает внешняя система

Кто-нибудь сталкивался с такой проблемой?
Как ее можно решить?

Спасибо.
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.