Что это за кодировка? - WIN API

Здравствуйте, big-town, Вы писали:

BT>Сам долго мучился пока разгадал что эта за кодировка.

BT>C3 A7 │ 2D C3 A9 20 │ C3 AF C3 AE │ C3 A4 C3 BC │ C3 A5 C3 A7 — Щорса
BT>С этой кодировкой я столкнулся в свитче DLINK 2108.

На самом деле парность символов за пределами ASCII подсказывает, что это utf-8, но испорченный преобразованием между двумя 8-битными кодировками. Осталось понять, какие это были кодировки. Здесь приведён кусок надписи "з-й подъез(д)" (причём через "з", а не цифру 3). Но символы сдвинуты (A0-BF для строчных 32-буквенного базового русского ряда). Итого оно восстанавливается так (при консоли в utf-8):

$ printf '\xC3\xA7\x2D\xC3\xA9\x20\xC3\xAF\xC3\xAE\xC3\xA4\xC3\xBC\xC3\xA5\xC3\xA7\n' | iconv -f utf-8 -t iso-8859-1 | iconv -f cp1251 -t utf-8
з-й подьез

и никакой MIK тут ни при чём.

А что там перепутали в свиче — ХЗ, мне больше интересно, при чём тут третий подъезд к свичу. (UPDATE: а, понял, описание порта свича в сохранённом конфиге.)

Здравствуйте, netch80, Вы писали:

N>А что там перепутали в свиче — ХЗ, мне больше интересно, при чём тут третий подъезд к свичу

А мне еще интересно, при чем тут WIN API

Сам долго мучился пока разгадал что эта за кодировка.

C3 A7 │ 2D C3 A9 20 │ C3 AF C3 AE │ C3 A4 C3 BC │ C3 A5 C3 A7 — Щорса
С этой кодировкой я столкнулся в свитче DLINK 2108.

Набросал простенький скрипт для перебора всех возможных кодировок, при использовании мощного конвертера iconv (кросплатформенный).

for CP in `iconv --list | sed 's/,/ /g' | sed 's/\/\///g'`
do
echo $CP
cat koi | iconv -f $CP -t utf8 | grep -i 'Щ'
done

И на кодировке MIK я получил что то подобное "├Щ├о├р├с├а".
Пропустив его через фильтр iconv -f MIK -t utf8 | sed 's/├//g'
я получил читабельный русский шрифт.

Может кому то будет полезно

От:	netch80	http://netch80.dreamwidth.org/
Дата:	27.01.15 19:46
Оценка:	+1

	От:	Pavel Dvorkin
	Дата:	28.01.15 03:54
	Оценка:	+2

	От:	big-town
	Дата:	26.01.15 19:57
	Оценка: