Здравствуйте, big-town, Вы писали:
BT>Сам долго мучился пока разгадал что эта за кодировка.
BT>C3 A7 │ 2D C3 A9 20 │ C3 AF C3 AE │ C3 A4 C3 BC │ C3 A5 C3 A7 — Щорса
BT>С этой кодировкой я столкнулся в свитче DLINK 2108.
На самом деле парность символов за пределами ASCII подсказывает, что это utf-8, но испорченный преобразованием между двумя 8-битными кодировками. Осталось понять, какие это были кодировки. Здесь приведён кусок надписи "з-й подъез(д)" (причём через "з", а не цифру 3). Но символы сдвинуты (A0-BF для строчных 32-буквенного базового русского ряда). Итого оно восстанавливается так (при консоли в utf-8):
$ printf '\xC3\xA7\x2D\xC3\xA9\x20\xC3\xAF\xC3\xAE\xC3\xA4\xC3\xBC\xC3\xA5\xC3\xA7\n' | iconv -f utf-8 -t iso-8859-1 | iconv -f cp1251 -t utf-8
з-й подьез
и никакой MIK тут ни при чём.
А что там перепутали в свиче — ХЗ, мне больше интересно, при чём тут третий подъезд к свичу. (UPDATE: а, понял, описание порта свича в сохранённом конфиге.)
Здравствуйте, netch80, Вы писали:
N>А что там перепутали в свиче — ХЗ, мне больше интересно, при чём тут третий подъезд к свичу
А мне еще интересно, при чем тут WIN API
Сам долго мучился пока разгадал что эта за кодировка.
C3 A7 │ 2D C3 A9 20 │ C3 AF C3 AE │ C3 A4 C3 BC │ C3 A5 C3 A7 — Щорса
С этой кодировкой я столкнулся в свитче DLINK 2108.
Набросал простенький скрипт для перебора всех возможных кодировок, при использовании мощного конвертера iconv (кросплатформенный).
for CP in `iconv --list | sed 's/,/ /g' | sed 's/\/\///g'`
do
echo $CP
cat koi | iconv -f $CP -t utf8 | grep -i 'Щ'
done
И на кодировке MIK я получил что то подобное "├Щ├о├р├с├а".
Пропустив его через фильтр
iconv -f MIK -t utf8 | sed 's/├//g'
я получил читабельный русский шрифт.
Может кому то будет полезно