Каким алгоритмом закодированы даты? - Алгоритмы

Здравствуйте, senfedro, Вы писали:

S>Каким алгоритмом закодированы даты?

S>Апрель закодирован так
S>

S>%D0%90%D0%BF%D1%80%D0%B5%D0%BB%D1%8C
S>

S>Гугл не знает.
S>Спасибо за ответы.

url encoded, utf-8

Здравствуйте, senfedro, Вы писали:

S>Апрель закодирован так
S>

S>%D0%90%D0%BF%D1%80%D0%B5%D0%BB%D1%8C
S>

UTF8

... << RSDN@Home 1.1.4 stable SR1 rev. 568>>

Здравствуйте, senfedro, Вы писали:

S>Каким алгоритмом закодированы даты?

S>Апрель закодирован так
S>

S>%D0%90%D0%BF%D1%80%D0%B5%D0%BB%D1%8C
S>

Последние 5 копеек в тему:

$ python
Python 2.6.6 (r266:84292, Sep 18 2010, 22:02:06) 
[GCC 4.2.1 20070719  [FreeBSD]] on freebsd8
Type "help", "copyright", "credits" or "license" for more information.
>>> a = "%D0%90%D0%BF%D1%80%D0%B5%D0%BB%D1%8C"
>>> b = urllib.unquote(a)
>>> print b.decode('utf-8').encode('koi8-r')
Апрель

Здравствуйте, netch80, Вы писали:
N>

>>>> print b.decode('utf-8').encode('koi8-r')
N>

Ужас! =8-O

Здравствуйте, gegMOPO4, Вы писали:

MOP>Здравствуйте, netch80, Вы писали:
N>>

>>>>> print b.decode('utf-8').encode('koi8-r')
N>>

MOP>Ужас! =8-O

Не вижу ничего ужасного. На ряде систем у меня сохраняется koi8-r как основная системная кодировка, иначе слишком неудобно. И это всяко лучше разных там cp1251.;)

Здравствуйте, netch80, Вы писали:

N>Здравствуйте, gegMOPO4, Вы писали:

MOP>>Здравствуйте, netch80, Вы писали:
N>>>

>>>>>> print b.decode('utf-8').encode('koi8-r')
N>>>

MOP>>Ужас! =8-O

N>Не вижу ничего ужасного. На ряде систем у меня сохраняется koi8-r как основная системная кодировка, иначе слишком неудобно. И это всяко лучше разных там cp1251.

ну да, сравнил. в cp1251 побольше символов, употребляемых в россии, войдет. а в koi8-r одни символы графики

к тому жэ 95% посетителей в интернете сидят за виндой

Здравствуйте, netch80, Вы писали:
N>Здравствуйте, gegMOPO4, Вы писали:
MOP>>Здравствуйте, netch80, Вы писали:
N>>>

>>>>>> print b.decode('utf-8').encode('koi8-r')
N>>>

MOP>>Ужас! =8-O
N>Не вижу ничего ужасного. На ряде систем у меня сохраняется koi8-r как основная системная кодировка, иначе слишком неудобно. И это всяко лучше разных там cp1251.

Из 8-битных кодировок всё же cp1251 является наиболее удобной для русского языка (я уж молчу о украинском). Работая с современным текстом, больше вероятность поиметь неприятность в koi8-r, чем в cp1251 (—, «, », №, неразрывный пробел). А если необходимо совместить с псевдографическими рамочками, выход один — уникод.

Но отставив холивар, замечу, что .encode('koi8-r') в примере выше вообще не нужен. print замечательно выведет и уникодную строку.

Здравствуйте, gegMOPO4, Вы писали:

N>>Не вижу ничего ужасного. На ряде систем у меня сохраняется koi8-r как основная системная кодировка, иначе слишком неудобно. И это всяко лучше разных там cp1251.;)
MOP>Из 8-битных кодировок всё же cp1251 является наиболее удобной для русского языка (я уж молчу о украинском).

Это в сферической в вакууме обстановке. А не на юниксе в интернете.

MOP>Но отставив холивар, замечу, что .encode('koi8-r') в примере выше вообще не нужен. print замечательно выведет и уникодную строку.

Я в этом совсем не был уверен — по крайней мере для 2-го питона. Оказалось, таки да. Но мне это сейчас совершенно непринципиально, почти лишнее знание.

Здравствуйте, netch80, Вы писали:
N>Здравствуйте, gegMOPO4, Вы писали:
N>>>Не вижу ничего ужасного. На ряде систем у меня сохраняется koi8-r как основная системная кодировка, иначе слишком неудобно. И это всяко лучше разных там cp1251.

MOP>>Из 8-битных кодировок всё же cp1251 является наиболее удобной для русского языка (я уж молчу о украинском).
N>Это в сферической в вакууме обстановке. А не на юниксе в интернете.

Как раз не в вакууме cp1251 распространённее (и удобнее, если мы не хотим лишних вопросов и псевдографики вместо тире и кавычек, как бывает на некоторых ламерских сайтах). А по уму, всё следует приводить к utf-8, в разных текстах могут быть и европейские алфавиты с диакритикой, и рамочки из досовских текстов.

MOP>>Но отставив холивар, замечу, что .encode('koi8-r') в примере выше вообще не нужен. print замечательно выведет и уникодную строку.
N>Я в этом совсем не был уверен — по крайней мере для 2-го питона. Оказалось, таки да. Но мне это сейчас совершенно непринципиально, почти лишнее знание.

Зато вопрошающий при попытке воспроизвести результат (кстати, пропущен import urllib) получил бы ожидаемое, а не ��, не бРТЕМШ и не с╨╥┼╠╪.

А вот нелишним знанием будет то, что вы всё сделали правильно.

Иначе при попытке перенаправить вывод скрипта в файл получили бы сюрприз.

	От:	senfedro
	Дата:	08.04.11 06:46
	Оценка:

	От:	Аноним
	Дата:	08.04.11 06:52
	Оценка:

	От:	ilnar
	Дата:	08.04.11 07:08
	Оценка:

	От:	CreatorCray
	Дата:	08.04.11 07:14
	Оценка:

От:	netch80	http://netch80.dreamwidth.org/
Дата:	08.04.11 08:47
Оценка:

	От:	gegMOPO4
	Дата:	09.04.11 13:40
	Оценка:

	От:	gegMOPO4
	Дата:	09.04.11 17:32
	Оценка:

	От:	gegMOPO4
	Дата:	09.04.11 19:00
	Оценка: