Не вижу ничего ужасного. На ряде систем у меня сохраняется koi8-r как основная системная кодировка, иначе слишком неудобно. И это всяко лучше разных там cp1251.;)
MOP>>Ужас! =8-O
N>Не вижу ничего ужасного. На ряде систем у меня сохраняется koi8-r как основная системная кодировка, иначе слишком неудобно. И это всяко лучше разных там cp1251.
ну да, сравнил. в cp1251 побольше символов, употребляемых в россии, войдет. а в koi8-r одни символы графики
к тому жэ 95% посетителей в интернете сидят за виндой
MOP>>Ужас! =8-O N>Не вижу ничего ужасного. На ряде систем у меня сохраняется koi8-r как основная системная кодировка, иначе слишком неудобно. И это всяко лучше разных там cp1251.
Из 8-битных кодировок всё же cp1251 является наиболее удобной для русского языка (я уж молчу о украинском). Работая с современным текстом, больше вероятность поиметь неприятность в koi8-r, чем в cp1251 (—, «, », №, неразрывный пробел). А если необходимо совместить с псевдографическими рамочками, выход один — уникод.
Но отставив холивар, замечу, что .encode('koi8-r') в примере выше вообще не нужен. print замечательно выведет и уникодную строку.
Здравствуйте, gegMOPO4, Вы писали:
N>>Не вижу ничего ужасного. На ряде систем у меня сохраняется koi8-r как основная системная кодировка, иначе слишком неудобно. И это всяко лучше разных там cp1251.;) MOP>Из 8-битных кодировок всё же cp1251 является наиболее удобной для русского языка (я уж молчу о украинском).
Это в сферической в вакууме обстановке. А не на юниксе в интернете.
MOP>Но отставив холивар, замечу, что .encode('koi8-r') в примере выше вообще не нужен. print замечательно выведет и уникодную строку.
Я в этом совсем не был уверен — по крайней мере для 2-го питона. Оказалось, таки да. Но мне это сейчас совершенно непринципиально, почти лишнее знание.
Здравствуйте, netch80, Вы писали: N>Здравствуйте, gegMOPO4, Вы писали: N>>>Не вижу ничего ужасного. На ряде систем у меня сохраняется koi8-r как основная системная кодировка, иначе слишком неудобно. И это всяко лучше разных там cp1251. MOP>>Из 8-битных кодировок всё же cp1251 является наиболее удобной для русского языка (я уж молчу о украинском). N>Это в сферической в вакууме обстановке. А не на юниксе в интернете.
Как раз не в вакууме cp1251 распространённее (и удобнее, если мы не хотим лишних вопросов и псевдографики вместо тире и кавычек, как бывает на некоторых ламерских сайтах). А по уму, всё следует приводить к utf-8, в разных текстах могут быть и европейские алфавиты с диакритикой, и рамочки из досовских текстов.
MOP>>Но отставив холивар, замечу, что .encode('koi8-r') в примере выше вообще не нужен. print замечательно выведет и уникодную строку. N>Я в этом совсем не был уверен — по крайней мере для 2-го питона. Оказалось, таки да. Но мне это сейчас совершенно непринципиально, почти лишнее знание.
Зато вопрошающий при попытке воспроизвести результат (кстати, пропущен import urllib) получил бы ожидаемое, а не ������, не бРТЕМШ и не с╨╥┼╠╪.
А вот нелишним знанием будет то, что вы всё сделали правильно. Иначе при попытке перенаправить вывод скрипта в файл получили бы сюрприз.