У меня есть программа, к которой по TCP приходят некоторые данные,
которые она должна обрабатывать. Есть и русскоязычные данные,
которые посылаются в какой-то кодировке, которая не описана в документации.
Пробовали разные варианты и оказалось, что подходит UTF-8.
Но есть один нюанс.
Если я открываю протокол программы и, допустим, копирую некоторый русский текст в ноутпаде в отдельный файл,
то затем открываю этот файл и он декодируется в читаемый текст. Причем IE автоматически определяет UTF-8.
Но если я вырезаю русский текст FAR'ом то получается файл, который НЕ ДЕКОДИРУЕТСЯ!
Вот файл, который вырезался ноутпадом, он декодируется нормально:
http://files.rsdn.ru/79111/2.txt
Вот файл, который вырезался FAR'ом, он не декодируется:
http://files.rsdn.ru/79111/1.txt
Не могу понять, в чем дело. Выглядят файлы очень похоже, но самое интересное (!) — в FAR'е вообще
эти файлы в просмотровщике выглядят одинаково, только в HEX-режиме видно, что некоторые байты различаются.
Как мог FAR испортить кодировку?
Far 1.7 не умеет юникод. Попробуйте, может, второй.