ФАС вступилась за SMS-сообщения на русском языке
От: dimgel Россия https://github.com/dimgel
Дата: 05.08.11 05:27
Оценка: 1 (1)
http://top.rbc.ru/society/05/08/2011/608986.shtml

Чую, что тема богатая, а доказать не могу. Интересно, правда смски все в UTF8 гоняют? И как это будут объяснять потребителю?
Re: ФАС вступилась за SMS-сообщения на русском языке
От: мыщъх США http://nezumi-lab.org
Дата: 05.08.11 05:41
Оценка: 1 (1)
Здравствуйте, dimgel, Вы писали:

D>http://top.rbc.ru/society/05/08/2011/608986.shtml

D>Чую, что тема богатая, а доказать не могу.
D> Интересно, правда смски все в UTF8 гоняют? И как это будут объяснять потребителю?
http://www.dreamfabric.com/sms/ там вообще 7-бит кодировка для латинцы. но проткол, конечно, не очень умный. там как бы указывается кодировка, но как бы это не помогает. для сообщений из одной кирилицы хватило бы тех же 7 бит на символ.

я как бы за инициативу ФАС, но не понимаю причем тут производители телефонов? им нужно к разработчикам протоколов. пускай жалуются в ieee.
americans fought a war for a freedom. another one to end slavery. so, what do some of them choose to do with their freedom? become slaves.
Re[2]: ФАС вступилась за SMS-сообщения на русском языке
От: dimgel Россия https://github.com/dimgel
Дата: 05.08.11 05:50
Оценка:
Здравствуйте, мыщъх, Вы писали:

D>> Интересно, правда смски все в UTF8 гоняют? И как это будут объяснять потребителю?

М>http://www.dreamfabric.com/sms/ там вообще 7-бит кодировка для латинцы.

А для русских букв походу UCS2 (впрочем, я просмотрел по диагонали).

М>я как бы за инициативу ФАС, но не понимаю причем тут производители телефонов?


Да эти-то точно не при чём. Либо журналисты оказались на месте раньше экспертов, либо одно из двух.

М>им нужно к разработчикам протоколов. пускай жалуются в ieee.


В спортлото ещё обязательно.
Re[3]: ФАС вступилась за SMS-сообщения на русском языке
От: dimgel Россия https://github.com/dimgel
Дата: 05.08.11 05:51
Оценка:
Здравствуйте, dimgel, Вы писали:

М>>я как бы за инициативу ФАС, но не понимаю причем тут производители телефонов?

D>Да эти-то точно не при чём. Либо журналисты оказались на месте раньше экспертов, либо одно из двух.

Хм, либо-таки формат SMS vendor-specific, о чём по твоей ссылке есть упоминания. Так что может быть они всё-таки причём.
Re: ФАС вступилась за SMS-сообщения на русском языке
От: netch80 Украина http://netch80.dreamwidth.org/
Дата: 05.08.11 05:55
Оценка:
Здравствуйте, dimgel, Вы писали:

D>http://top.rbc.ru/society/05/08/2011/608986.shtml


D>Чую, что тема богатая, а доказать не могу. :) Интересно, правда смски все в UTF8 гоняют?


В UCS-2. По кодированию SMS достаточно документов в Сети включая оригиналы стандартов GSM.
Вкратце — есть несколько наборов символов (кстати, ASCII среди них нет) и в служебной части SMS указывается конкретный набор. Ближайший к ASCII — GSM — там много замен в небуквенной части.

D> И как это будут объяснять потребителю?


Думаю, сошлются на международный стандарт и встречно потребуют, чтобы какой-то из государственных НИИ связи вошёл в комитет GSM и продвинул специфическую кодировку. Вероятность успеха близка к 0, но попробовать они обязаны.
The God is real, unless declared integer.
Re: ФАС вступилась за SMS-сообщения на русском языке
От: Micht  
Дата: 05.08.11 05:59
Оценка: 3 (3) +1
Здравствуйте, dimgel, Вы писали:

D>http://top.rbc.ru/society/05/08/2011/608986.shtml


D>Чую, что тема богатая, а доказать не могу. Интересно, правда смски все в UTF8 гоняют? И как это будут объяснять потребителю?


Операторы здесь, конечно же не при чем (если не брать в рассчет дикую цену за отправку двухсот байт).


В GSM используется 4 кодировки — семибитка, восьмибитка (тоже самое, только без геморроя), UCS2 и Packed UCS2. При этом в SMS по стандарту может быть только 7-бит или UCS2.

Кроме SMS 7-бит фактически НИГДЕ в GSM больше не встречается.
В 7-бит есть спецсимвол, который означает выбор символа из "расширенной" таблицы, в которой в свою очередь есть тот же код и т.д. теоретически до бесконечности. Стандарт описывает основную страницу и одну "расширенную".
Тому гению, который придумал 7-бит и сэкономил аж целых 20 символов на одно сообщение, надо сделать [что-то очень нехорошее].

Почему нельзя было разрешить использовать Packed UCS2 — вообще непонятно.

Zip со стандартом, описывающим кодировки
Re[3]: ФАС вступилась за SMS-сообщения на русском языке
От: мыщъх США http://nezumi-lab.org
Дата: 05.08.11 05:59
Оценка: :)))
Здравствуйте, dimgel, Вы писали:

D>Здравствуйте, мыщъх, Вы писали:


М>>им нужно к разработчикам протоколов. пускай жалуются в ieee.

D>В спортлото ещё обязательно.
ну если вспомнить, что ieee это экссср, то вроде бы у россии там должно быть влияние. пускай разные ведомства теперь разбираются.

ЗЫ. хотя элементарное решение проблемы -- поднять за eng сообщения цену в два раза и тогда русское сообщение аналогичного размера будет можно отправить по той же цене

ЗЫ.ЗЫ. нет, в два мало. английский язык по статистике на 30% короче, но это в теории. в реале на смс по английски писать (сокращенно, конечно) получается короче раз в пять и при этом читабельно. по русски коротко ну никак на напишешь. ну вот как сказать cy по русски? б? могут не так понят. "ув" -- тоже поймут не правилоно. "пка" -- вроде бы поймут, но это все-таки три буквы вместо двух. или как сказать "винт от сигейт" русски? по eng это будет cg8hdd. и собеседник вас поймет. а есть вариант на русском?

так что русскоязычные отправители смс все равно в невыгодном положении и потому нужно написать жалобу в министерство русского языка. пускай выкинут из слов все лишние буквы.
americans fought a war for a freedom. another one to end slavery. so, what do some of them choose to do with their freedom? become slaves.
Re[4]: ФАС вступилась за SMS-сообщения на русском языке
От: FirstStep Россия  
Дата: 06.08.11 05:35
Оценка: :))
Здравствуйте, мыщъх, Вы писали:


М>ЗЫ.ЗЫ. нет, в два мало. английский язык по статистике на 30% короче, но это в теории. в реале на смс по английски писать (сокращенно, конечно) получается короче раз в пять и при этом читабельно. по русски коротко ну никак на напишешь. ну вот как сказать cy по русски? б? могут не так понят. "ув" -- тоже поймут не правилоно. "пка" -- вроде бы поймут, но это все-таки три буквы вместо двух. или как сказать "винт от сигейт" русски? по eng это будет cg8hdd. и собеседник вас поймет. а есть вариант на русском?


М>так что русскоязычные отправители смс все равно в невыгодном положении и потому нужно написать жалобу в министерство русского языка. пускай выкинут из слов все лишние буквы.



При анализе второй мировой войны, американские военные историки обнаружили очень интересный факт. А именно: при внезапном столкновении с силами японцев американцы, как правило, гораздо быстрее принимали решения и, как следствие, побеждали даже превосходящие силы противника.
Исследовав данную закономерность, ученые пришли к выводу, что средняя длина слова у американцев составляет 5,2 символа, тогда как у японцев 10,8 и, следовательно, на отдачу приказов уходит на 56% меньше времени, что в коротком бою играет немаловажную роль.
Ради интереса они проанализировали русскую речь, и оказалось, что длина слова в русском языке составляет 7,2 символа на слово (в среднем), однако при критических ситуациях русско-язычный командный состав переходит на ненормативную лексику и длина слова сокращается до: 3,2 символов в слове.

Так что не надо жаловаться в министерство, надо переходить на великий могучий матерный
Re[5]: ФАС вступилась за SMS-сообщения на русском языке
От: dimgel Россия https://github.com/dimgel
Дата: 06.08.11 05:46
Оценка:
Здравствуйте, FirstStep, Вы писали:

FS>Так что не надо жаловаться в министерство, надо переходить на великий могучий матерный


Кому надо уже давно перешли. Только он не так удобен при SMS-переписке, когда жестикуляцией можно передать недостающую информацию.

У меня вот кстати идея получше есть в плане компактности трафика, для русских телефонов по крайней мере:
(1) создаём некий единый стандартизированный словарь для T9. Можно даже привинтить к нему версионирование и чтобы телефоны автоматом скачивали обновления.
(2) каждая буква кодируется в 3 бита, по индексу соответствующей клавиши телефона (на телефоне все буквы на клавишах 2-9, всего как раз 8 клавиш).
(3) каждое слово кодируется последовательностью букв плюс 1 бит ru/en, плюс в пределах 1 байта (зависит от версии словаря) на порядковый номер варианта слова в универсальном словаре T9.
(4) что делать с остальными символами — можно взять, например, идею из RLE-кодирования (так, кажется, убого-сжатый BMP когда-то назывался?).
(5) если словарь версионируется, значит протокол передачи SMS должен предусматривать получение оператором версий словаря источника и получателя SMS и конвертации на мощностях оператора.

Гы. Во.
Re[6]: ФАС вступилась за SMS-сообщения на русском языке
От: Ops Россия  
Дата: 06.08.11 08:09
Оценка:
Здравствуйте, dimgel, Вы писали:

D>Здравствуйте, FirstStep, Вы писали:


FS>>Так что не надо жаловаться в министерство, надо переходить на великий могучий матерный


D>Кому надо уже давно перешли. Только он не так удобен при SMS-переписке, когда жестикуляцией можно передать недостающую информацию.


D>У меня вот кстати идея получше есть в плане компактности трафика, для русских телефонов по крайней мере:

D>(1) создаём некий единый стандартизированный словарь для T9. Можно даже привинтить к нему версионирование и чтобы телефоны автоматом скачивали обновления.
D>(2) каждая буква кодируется в 3 бита, по индексу соответствующей клавиши телефона (на телефоне все буквы на клавишах 2-9, всего как раз 8 клавиш).
D>(3) каждое слово кодируется последовательностью букв плюс 1 бит ru/en, плюс в пределах 1 байта (зависит от версии словаря) на порядковый номер варианта слова в универсальном словаре T9.
D>(4) что делать с остальными символами — можно взять, например, идею из RLE-кодирования (так, кажется, убого-сжатый BMP когда-то назывался?).
D>(5) если словарь версионируется, значит протокол передачи SMS должен предусматривать получение оператором версий словаря источника и получателя SMS и конвертации на мощностях оператора.

D>Гы. Во.

А не проще просто сжимать и передавать в бинарном виде?
Переубедить Вас, к сожалению, мне не удастся, поэтому сразу перейду к оскорблениям.
Re[7]: ФАС вступилась за SMS-сообщения на русском языке
От: dimgel Россия https://github.com/dimgel
Дата: 06.08.11 08:56
Оценка:
Здравствуйте, Ops, Вы писали:

Ops>А не проще просто сжимать и передавать в бинарном виде?


Ну и сжимать потом тоже, да. Мне думается, что алгоритм, использующий знание о структуре данных (да ещё и с общим словарём) будет эффективнее.
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.