Здравствуйте, dimgel, Вы писали:
D>http://top.rbc.ru/society/05/08/2011/608986.shtml D>Чую, что тема богатая, а доказать не могу. D> Интересно, правда смски все в UTF8 гоняют? И как это будут объяснять потребителю? http://www.dreamfabric.com/sms/ там вообще 7-бит кодировка для латинцы. но проткол, конечно, не очень умный. там как бы указывается кодировка, но как бы это не помогает. для сообщений из одной кирилицы хватило бы тех же 7 бит на символ.
я как бы за инициативу ФАС, но не понимаю причем тут производители телефонов? им нужно к разработчикам протоколов. пускай жалуются в ieee.
americans fought a war for a freedom. another one to end slavery. so, what do some of them choose to do with their freedom? become slaves.
Re[2]: ФАС вступилась за SMS-сообщения на русском языке
Здравствуйте, мыщъх, Вы писали:
D>> Интересно, правда смски все в UTF8 гоняют? И как это будут объяснять потребителю? М>http://www.dreamfabric.com/sms/ там вообще 7-бит кодировка для латинцы.
А для русских букв походу UCS2 (впрочем, я просмотрел по диагонали).
М>я как бы за инициативу ФАС, но не понимаю причем тут производители телефонов?
Да эти-то точно не при чём. Либо журналисты оказались на месте раньше экспертов, либо одно из двух.
М>им нужно к разработчикам протоколов. пускай жалуются в ieee.
В спортлото ещё обязательно.
Re[3]: ФАС вступилась за SMS-сообщения на русском языке
Здравствуйте, dimgel, Вы писали:
М>>я как бы за инициативу ФАС, но не понимаю причем тут производители телефонов? D>Да эти-то точно не при чём. Либо журналисты оказались на месте раньше экспертов, либо одно из двух.
Хм, либо-таки формат SMS vendor-specific, о чём по твоей ссылке есть упоминания. Так что может быть они всё-таки причём.
Re: ФАС вступилась за SMS-сообщения на русском языке
В UCS-2. По кодированию SMS достаточно документов в Сети включая оригиналы стандартов GSM.
Вкратце — есть несколько наборов символов (кстати, ASCII среди них нет) и в служебной части SMS указывается конкретный набор. Ближайший к ASCII — GSM — там много замен в небуквенной части.
D> И как это будут объяснять потребителю?
Думаю, сошлются на международный стандарт и встречно потребуют, чтобы какой-то из государственных НИИ связи вошёл в комитет GSM и продвинул специфическую кодировку. Вероятность успеха близка к 0, но попробовать они обязаны.
The God is real, unless declared integer.
Re: ФАС вступилась за SMS-сообщения на русском языке
Здравствуйте, dimgel, Вы писали:
D>http://top.rbc.ru/society/05/08/2011/608986.shtml
D>Чую, что тема богатая, а доказать не могу. Интересно, правда смски все в UTF8 гоняют? И как это будут объяснять потребителю?
Операторы здесь, конечно же не при чем (если не брать в рассчет дикую цену за отправку двухсот байт).
В GSM используется 4 кодировки — семибитка, восьмибитка (тоже самое, только без геморроя), UCS2 и Packed UCS2. При этом в SMS по стандарту может быть только 7-бит или UCS2.
Кроме SMS 7-бит фактически НИГДЕ в GSM больше не встречается.
В 7-бит есть спецсимвол, который означает выбор символа из "расширенной" таблицы, в которой в свою очередь есть тот же код и т.д. теоретически до бесконечности. Стандарт описывает основную страницу и одну "расширенную".
Тому гению, который придумал 7-бит и сэкономил аж целых 20 символов на одно сообщение, надо сделать [что-то очень нехорошее].
Почему нельзя было разрешить использовать Packed UCS2 — вообще непонятно.
Здравствуйте, dimgel, Вы писали:
D>Здравствуйте, мыщъх, Вы писали:
М>>им нужно к разработчикам протоколов. пускай жалуются в ieee. D>В спортлото ещё обязательно.
ну если вспомнить, что ieee это экссср, то вроде бы у россии там должно быть влияние. пускай разные ведомства теперь разбираются.
ЗЫ. хотя элементарное решение проблемы -- поднять за eng сообщения цену в два раза и тогда русское сообщение аналогичного размера будет можно отправить по той же цене
ЗЫ.ЗЫ. нет, в два мало. английский язык по статистике на 30% короче, но это в теории. в реале на смс по английски писать (сокращенно, конечно) получается короче раз в пять и при этом читабельно. по русски коротко ну никак на напишешь. ну вот как сказать cy по русски? б? могут не так понят. "ув" -- тоже поймут не правилоно. "пка" -- вроде бы поймут, но это все-таки три буквы вместо двух. или как сказать "винт от сигейт" русски? по eng это будет cg8hdd. и собеседник вас поймет. а есть вариант на русском?
так что русскоязычные отправители смс все равно в невыгодном положении и потому нужно написать жалобу в министерство русского языка. пускай выкинут из слов все лишние буквы.
americans fought a war for a freedom. another one to end slavery. so, what do some of them choose to do with their freedom? become slaves.
Re[4]: ФАС вступилась за SMS-сообщения на русском языке
М>ЗЫ.ЗЫ. нет, в два мало. английский язык по статистике на 30% короче, но это в теории. в реале на смс по английски писать (сокращенно, конечно) получается короче раз в пять и при этом читабельно. по русски коротко ну никак на напишешь. ну вот как сказать cy по русски? б? могут не так понят. "ув" -- тоже поймут не правилоно. "пка" -- вроде бы поймут, но это все-таки три буквы вместо двух. или как сказать "винт от сигейт" русски? по eng это будет cg8hdd. и собеседник вас поймет. а есть вариант на русском?
М>так что русскоязычные отправители смс все равно в невыгодном положении и потому нужно написать жалобу в министерство русского языка. пускай выкинут из слов все лишние буквы.
При анализе второй мировой войны, американские военные историки обнаружили очень интересный факт. А именно: при внезапном столкновении с силами японцев американцы, как правило, гораздо быстрее принимали решения и, как следствие, побеждали даже превосходящие силы противника.
Исследовав данную закономерность, ученые пришли к выводу, что средняя длина слова у американцев составляет 5,2 символа, тогда как у японцев 10,8 и, следовательно, на отдачу приказов уходит на 56% меньше времени, что в коротком бою играет немаловажную роль.
Ради интереса они проанализировали русскую речь, и оказалось, что длина слова в русском языке составляет 7,2 символа на слово (в среднем), однако при критических ситуациях русско-язычный командный состав переходит на ненормативную лексику и длина слова сокращается до: 3,2 символов в слове.
Так что не надо жаловаться в министерство, надо переходить на великий могучий матерный
Re[5]: ФАС вступилась за SMS-сообщения на русском языке
Здравствуйте, FirstStep, Вы писали:
FS>Так что не надо жаловаться в министерство, надо переходить на великий могучий матерный
Кому надо уже давно перешли. Только он не так удобен при SMS-переписке, когда жестикуляцией можно передать недостающую информацию.
У меня вот кстати идея получше есть в плане компактности трафика, для русских телефонов по крайней мере:
(1) создаём некий единый стандартизированный словарь для T9. Можно даже привинтить к нему версионирование и чтобы телефоны автоматом скачивали обновления.
(2) каждая буква кодируется в 3 бита, по индексу соответствующей клавиши телефона (на телефоне все буквы на клавишах 2-9, всего как раз 8 клавиш).
(3) каждое слово кодируется последовательностью букв плюс 1 бит ru/en, плюс в пределах 1 байта (зависит от версии словаря) на порядковый номер варианта слова в универсальном словаре T9.
(4) что делать с остальными символами — можно взять, например, идею из RLE-кодирования (так, кажется, убого-сжатый BMP когда-то назывался?).
(5) если словарь версионируется, значит протокол передачи SMS должен предусматривать получение оператором версий словаря источника и получателя SMS и конвертации на мощностях оператора.
Гы. Во.
Re[6]: ФАС вступилась за SMS-сообщения на русском языке
Здравствуйте, dimgel, Вы писали:
D>Здравствуйте, FirstStep, Вы писали:
FS>>Так что не надо жаловаться в министерство, надо переходить на великий могучий матерный
D>Кому надо уже давно перешли. Только он не так удобен при SMS-переписке, когда жестикуляцией можно передать недостающую информацию.
D>У меня вот кстати идея получше есть в плане компактности трафика, для русских телефонов по крайней мере: D>(1) создаём некий единый стандартизированный словарь для T9. Можно даже привинтить к нему версионирование и чтобы телефоны автоматом скачивали обновления. D>(2) каждая буква кодируется в 3 бита, по индексу соответствующей клавиши телефона (на телефоне все буквы на клавишах 2-9, всего как раз 8 клавиш). D>(3) каждое слово кодируется последовательностью букв плюс 1 бит ru/en, плюс в пределах 1 байта (зависит от версии словаря) на порядковый номер варианта слова в универсальном словаре T9. D>(4) что делать с остальными символами — можно взять, например, идею из RLE-кодирования (так, кажется, убого-сжатый BMP когда-то назывался?). D>(5) если словарь версионируется, значит протокол передачи SMS должен предусматривать получение оператором версий словаря источника и получателя SMS и конвертации на мощностях оператора.
D>Гы. Во.
А не проще просто сжимать и передавать в бинарном виде?
Переубедить Вас, к сожалению, мне не удастся, поэтому сразу перейду к оскорблениям.
Re[7]: ФАС вступилась за SMS-сообщения на русском языке