Привет всем.
Написав систему репликации БД с использованием XML для транспортировки данных, обнаружили неприятную вещь:
наши доблестные пользователи, используя Word для подготовки данных и copy&paste, иногда в текстовые поля добавляют "не печатные" символы. Например, с кодом
6
Для записи/чтения XML-данных используются SAX-компоненты. При записи символы с кодом 6 попадают в XML без трансформации. При чтении возникает ошибка.
Я попробовал кодировать такие символы с помощью "&#SYMBOL_CODE;", но эффект нулевой.
Dim xml_doc As New MSXML2.DOMDocument40
If (Not xml_doc.loadXML("<a></a>")) Then
err.raise -1,,xml_doc.parseError.reason 'Invalid unicode character
End If
Вопрос,
что делать и как дальше жить?
Пока видится один основной путь — после формирования XML, уничтожать (кодировать же их не получается) в нем все "невостанавливаемые" символы.
Не дайте погибнуть — через три недели начнется промышленная эксплуатация
-- Пользователи не приняли программу. Всех пришлось уничтожить. --