Рутенберг ограничит длину символа в UTF-8 до одного байта
От: Skleroz Россия  
Дата: 06.08.11 02:17
Оценка:
http://www.finmarket.ru/z/nws/hotnews.asp?id=2312349

...
ФАС выяснила, что вины российских операторов связи в том, что SMS на кириллице вдвое короче SMS на латинице, нет, поскольку все зависит от производителей телефонов и международных стандартов кодировки. Служба запросит разъяснения о кириллических SMS у Европейского института стандартизации и вендоров
...
Не исключено, что теперь российским антимонопольщикам предстоит долгая переписка с европейскими чиновниками. ФАС может направить запросы в Европейский институт стандартизации телекоммуникаций (ETSI) и производителям телекоммуникационного оборудования, чтобы установить, почему для кириллических SMS-сообщений используется шестнадцатибитная кодировка, хотя существуют иные способы кодировать кириллицу, в том числе в восьмибитной кодировке, сказал Д.Рутенберг.
...


08.08.11 15:25: Перенесено модератором из 'Коллеги, улыбнитесь' — Blazkowicz
Re: Рутенберг ограничит длину символа в UTF-8 до одного байт
От: trickster Россия  
Дата: 06.08.11 02:35
Оценка:
Здравствуйте, Skleroz, Вы писали:

S>http://www.finmarket.ru/z/nws/hotnews.asp?id=2312349


S>

...
S>ФАС выяснила, что вины российских операторов связи в том, что SMS на кириллице вдвое короче SMS на латинице, нет, поскольку все зависит от производителей телефонов и международных стандартов кодировки. Служба запросит разъяснения о кириллических SMS у Европейского института стандартизации и вендоров
S>...
S>Не исключено, что теперь российским антимонопольщикам предстоит долгая переписка с европейскими чиновниками. ФАС может направить запросы в Европейский институт стандартизации телекоммуникаций (ETSI) и производителям телекоммуникационного оборудования, чтобы установить, почему для кириллических SMS-сообщений используется шестнадцатибитная кодировка, хотя существуют иные способы кодировать кириллицу, в том числе в восьмибитной кодировке, сказал Д.Рутенберг.
S>...


Спасибо, поржал. В чем проблема цену брать за количество символов?
Интересно, а если мне захочется использовать не русский и не английский, как они такой вариант сделают? новый юникод где русский влазит в первые 256? о_О
Re[2]: Рутенберг ограничит длину символа в UTF-8 до одного б
От: vsb Казахстан  
Дата: 06.08.11 05:22
Оценка: 1 (1) +6 :)
Здравствуйте, trickster, Вы писали:

T>Здравствуйте, Skleroz, Вы писали:


S>>http://www.finmarket.ru/z/nws/hotnews.asp?id=2312349


S>>

...
S>>ФАС выяснила, что вины российских операторов связи в том, что SMS на кириллице вдвое короче SMS на латинице, нет, поскольку все зависит от производителей телефонов и международных стандартов кодировки. Служба запросит разъяснения о кириллических SMS у Европейского института стандартизации и вендоров
S>>...
S>>Не исключено, что теперь российским антимонопольщикам предстоит долгая переписка с европейскими чиновниками. ФАС может направить запросы в Европейский институт стандартизации телекоммуникаций (ETSI) и производителям телекоммуникационного оборудования, чтобы установить, почему для кириллических SMS-сообщений используется шестнадцатибитная кодировка, хотя существуют иные способы кодировать кириллицу, в том числе в восьмибитной кодировке, сказал Д.Рутенберг.
S>>...


T>Спасибо, поржал. В чем проблема цену брать за количество символов?

T>Интересно, а если мне захочется использовать не русский и не английский, как они такой вариант сделают? новый юникод где русский влазит в первые 256? о_О

Специальная последовательность из двух байтов переключает кодировку. Для 99% российских СМС это будет последоватольность, переключающая на KOI8-R, в итоге СМС-ка будет длиннее не в 2 раза, а на 2 байта.

Смешного, тут, кстати, я ничего не вижу.
Re[3]: Рутенберг ограничит длину символа в UTF-8 до одного б
От: Working Class Hero  
Дата: 06.08.11 06:47
Оценка:
Здравствуйте, vsb, Вы писали:

vsb>Специальная последовательность из двух байтов переключает кодировку. Для 99% российских СМС это будет последоватольность, переключающая на KOI8-R, в итоге СМС-ка будет длиннее не в 2 раза, а на 2 байта.


vsb>Смешного, тут, кстати, я ничего не вижу.


Осталось только понять, как заставить понимать KOI-8 миллионы телефонов, выпущенных на сегодняшний день.
Re: Рутенберг ограничит длину символа в UTF-8 до одного байт
От: Klatu  
Дата: 06.08.11 06:48
Оценка: 1 (1) +4
Здравствуйте, Skleroz, Вы писали:

А меня больше интересует, почему смски стоят так дорого. Равно как и GPRS.
Re[4]: Рутенберг ограничит длину символа в UTF-8 до одного б
От: vsb Казахстан  
Дата: 06.08.11 07:06
Оценка: -1 :)
Здравствуйте, Working Class Hero, Вы писали:

WCH>Здравствуйте, vsb, Вы писали:


vsb>>Специальная последовательность из двух байтов переключает кодировку. Для 99% российских СМС это будет последоватольность, переключающая на KOI8-R, в итоге СМС-ка будет длиннее не в 2 раза, а на 2 байта.


vsb>>Смешного, тут, кстати, я ничего не вижу.


WCH>Осталось только понять, как заставить понимать KOI-8 миллионы телефонов, выпущенных на сегодняшний день.


Принять новый стандарт и обязать следовать ему производителей телефонов, ввозимых в страну и сотовых операторов. Тогда новые телефоны не будут иметь этих ограничений. Для старых телефонов станция будет делать перекодировку.
Re[5]: Рутенберг ограничит длину символа в UTF-8 до одного б
От: Working Class Hero  
Дата: 06.08.11 07:16
Оценка:
Здравствуйте, vsb, Вы писали:

vsb>Принять новый стандарт и обязать следовать ему производителей телефонов, ввозимых в страну и сотовых операторов. Тогда новые телефоны не будут иметь этих ограничений. Для старых телефонов станция будет делать перекодировку.


Вопросов много возникает. Достаточно ли для выполнения перкодировки "на лету" апгрейда программного обеспечения оборудования оператора? Или надо менять часть оборудования? Кто будет платить за все это (потребитель не хочет, в виде повышенных тарифов, ясное дело)? В конце-концов, что ФАС предлагает делать с имеющимися сотовыми телефонами, которые при отправке СМС на русском сами бьют его на части, если превышен порог в 60 символов? Считать две такие смс-ки как одну?
Re[5]: Я вот подумал, зачем так сложно?
От: Working Class Hero  
Дата: 06.08.11 07:38
Оценка:
Здравствуйте, vsb, Вы писали:

vsb>Принять новый стандарт и обязать следовать ему производителей телефонов, ввозимых в страну и сотовых операторов. Тогда новые телефоны не будут иметь этих ограничений. Для старых телефонов станция будет делать перекодировку.


Все более-менее современные телефоны поддерживают "склейку" сообщений, т.е. пишешь смс-ку, выходишь за лимит знаков — телефон отправляет длинное сообщение, как последовательность коротких. На принимающем телефоне они должны сшиваться в одно. Насколько я понимаю, в этом случае смс содержит признак, что оно отправляется несколькими частями. Ну и логично вытекающее отсюда решение проблемы — каждые две смс-ки, содержащие кириллицу и признак "склейки", тарифицируются как одно. Пользователи довольны, ФАС довольна, операторы не очень довольны, т.к. лишаются части прибыли, но, по крайней мере, это не самый худший для них вариант.
Re[5]: Рутенберг ограничит длину символа в UTF-8 до одного б
От: DOOM Россия  
Дата: 06.08.11 08:49
Оценка: 1 (1)
Здравствуйте, vsb, Вы писали:

vsb>Принять новый стандарт и обязать следовать ему производителей телефонов, ввозимых в страну и сотовых операторов. Тогда новые телефоны не будут иметь этих ограничений. Для старых телефонов станция будет делать перекодировку.

Ты вот про это серьезно? Или так — троллишь помаленьку?

Может еще за SMTP возьмемся — что за дискриминация, если не ASCII, то в Base64?
Re[6]: Рутенберг ограничит длину символа в UTF-8 до одного б
От: Working Class Hero  
Дата: 06.08.11 08:59
Оценка:
Здравствуйте, DOOM, Вы писали:

vsb>>Принять новый стандарт и обязать следовать ему производителей телефонов, ввозимых в страну и сотовых операторов. Тогда новые телефоны не будут иметь этих ограничений. Для старых телефонов станция будет делать перекодировку.

DOO>Ты вот про это серьезно? Или так — троллишь помаленьку?

DOO>Может еще за SMTP возьмемся — что за дискриминация, если не ASCII, то в Base64?


Да ладно вам. Разница в стоимости трафика за отправку имейлов в разных кодировках не так заметна, как разница в стоимости двух СМС вместо одной
Re[7]: Рутенберг ограничит длину символа в UTF-8 до одного б
От: DOOM Россия  
Дата: 06.08.11 09:58
Оценка:
Здравствуйте, Working Class Hero, Вы писали:

WCH>Да ладно вам. Разница в стоимости трафика за отправку имейлов в разных кодировках не так заметна, как разница в стоимости двух СМС вместо одной

Она не стоит того, чтобы возвращать геморрой однобайтовых кодировок.
К слову, я как-то не замечаю стоимость SMS — у меня в тарифе их то ли 100, то ли 150 бесплатных на месяц — я еще ни разу не израсходовал их.
Re[6]: Рутенберг ограничит длину символа в UTF-8 до одного б
От: vsb Казахстан  
Дата: 06.08.11 12:53
Оценка:
Здравствуйте, DOOM, Вы писали:

DOO>Здравствуйте, vsb, Вы писали:


vsb>>Принять новый стандарт и обязать следовать ему производителей телефонов, ввозимых в страну и сотовых операторов. Тогда новые телефоны не будут иметь этих ограничений. Для старых телефонов станция будет делать перекодировку.

DOO>Ты вот про это серьезно? Или так — троллишь помаленьку?
Высказываю своё мнение. Тема в юморе, поэтому может не совсем серьёзно, но всё же.

DOO>Может еще за SMTP возьмемся — что за дискриминация, если не ASCII, то в Base64?

А в смтп нет ограничений 140 символов на мейл. Что за него браться то.
Re[6]: Я вот подумал, зачем так сложно?
От: vsb Казахстан  
Дата: 06.08.11 12:53
Оценка:
Здравствуйте, Working Class Hero, Вы писали:

WCH>Здравствуйте, vsb, Вы писали:


vsb>>Принять новый стандарт и обязать следовать ему производителей телефонов, ввозимых в страну и сотовых операторов. Тогда новые телефоны не будут иметь этих ограничений. Для старых телефонов станция будет делать перекодировку.


WCH>Все более-менее современные телефоны поддерживают "склейку" сообщений, т.е. пишешь смс-ку, выходишь за лимит знаков — телефон отправляет длинное сообщение, как последовательность коротких. На принимающем телефоне они должны сшиваться в одно. Насколько я понимаю, в этом случае смс содержит признак, что оно отправляется несколькими частями. Ну и логично вытекающее отсюда решение проблемы — каждые две смс-ки, содержащие кириллицу и признак "склейки", тарифицируются как одно. Пользователи довольны, ФАС довольна, операторы не очень довольны, т.к. лишаются части прибыли, но, по крайней мере, это не самый худший для них вариант.


Можно и так. Но мне этот вариант не нравится, кривые стандарты должны выпрямляться, а не подпираться костылями.
Re[7]: Рутенберг ограничит длину символа в UTF-8 до одного б
От: DOOM Россия  
Дата: 06.08.11 13:03
Оценка:
Здравствуйте, vsb, Вы писали:

DOO>>Может еще за SMTP возьмемся — что за дискриминация, если не ASCII, то в Base64?

vsb>А в смтп нет ограничений 140 символов на мейл. Что за него браться то.
Ну и тарификации по письмам никогда не было.
А вот по байтам было. Для юриков особо ощутимо — представляешь тогда бы такую чушь раздувать начали?
Re[8]: Рутенберг ограничит длину символа в UTF-8 до одного б
От: aik Австралия  
Дата: 06.08.11 14:18
Оценка: -2
Здравствуйте, DOOM, Вы писали:

WCH>>Да ладно вам. Разница в стоимости трафика за отправку имейлов в разных кодировках не так заметна, как разница в стоимости двух СМС вместо одной

DOO>Она не стоит того, чтобы возвращать геморрой однобайтовых кодировок.

Откуда там геморрой если в начале писать что СМС в кои8? Не надо поддерживать пицот кодировок, одной хватит. Выигрыша от юникода я вообще не вижу.

DOO>К слову, я как-то не замечаю стоимость SMS — у меня в тарифе их то ли 100, то ли 150 бесплатных на месяц — я еще ни разу не израсходовал их.


Ну! Ты не заметил — значит, и другим по барабану, так и надо. А я, например, за границу часто шлю и в роумингах бываю — плюнул бы в рожу тому дебилу что придумал русские буквы юникодить.
Re[9]: Рутенберг ограничит длину символа в UTF-8 до одного б
От: 24  
Дата: 06.08.11 14:35
Оценка: +4
Здравствуйте, aik, Вы писали:

aik>Ну! Ты не заметил — значит, и другим по барабану, так и надо. А я, например, за границу часто шлю и в роумингах бываю — плюнул бы в рожу тому дебилу что придумал русские буквы юникодить.


Лучше тому, кто придумал выставлять такие цены за передачу 140-а байт.
Re[9]: Рутенберг ограничит длину символа в UTF-8 до одного б
От: DOOM Россия  
Дата: 06.08.11 14:46
Оценка: 1 (1) +1
Здравствуйте, aik, Вы писали:

aik>Откуда там геморрой если в начале писать что СМС в кои8? Не надо поддерживать пицот кодировок, одной хватит. Выигрыша от юникода я вообще не вижу.

Ну ты точно тролишь...
Откуда бНОПНЯ пошло не знаешь что ли? В электронной почте тоже всегда кодировка пишется перед блоком и чо? Редко что ли нечитаемые письма получаешь?


aik>Ну! Ты не заметил — значит, и другим по барабану, так и надо. А я, например, за границу часто шлю

Ох я бы полюбовался на тебя как бы ты слал SMS за границу — не будь юникода. Такое ощущение, что вы уже не помните эпоху однобайтного интернета...

aik>и в роумингах бываю — плюнул бы в рожу тому дебилу что придумал русские буквы юникодить.

Ты бы его благословил, если бы подумал еще немного.
Re[9]: Рутенберг ограничит длину символа в UTF-8 до одного б
От: Centaur Россия  
Дата: 06.08.11 14:49
Оценка: 1 (1) +1
Здравствуйте, aik, Вы писали:

DOO>>Она не стоит того, чтобы возвращать геморрой однобайтовых кодировок.

aik>Откуда там геморрой если в начале писать что СМС в кои8? Не надо поддерживать пицот кодировок, одной хватит. Выигрыша от юникода я вообще не вижу.

Не надо поддерживать пицот кодировок, одной хватит. И эта одна должна быть юникодом.

a koi-8 DOLVEN BYTX RAZRU[EN.
Re[9]: Рутенберг ограничит длину символа в UTF-8 до одного б
От: Banned by IT  
Дата: 06.08.11 16:17
Оценка:
Здравствуйте, aik, Вы писали:

aik>Откуда там геморрой если в начале писать что СМС в кои8? Не надо поддерживать пицот кодировок, одной хватит. Выигрыша от юникода я вообще не вижу.

А потом ещё для всех остальных языков такие подпорки сделать, а потом для собщений в которых несколько языков одновременно а потом опять вернёмся к Unicode.

aik>плюнул бы в рожу тому дебилу что придумал русские буквы юникодить.

Плюнь себе.
И займись ликбезом.
... << RSDN@Home 1.1.4 stable SR1 rev. 568>>
Забанили по IP, значит пора закрыть эту страницу.
Всем пока
Re[10]: Рутенберг ограничит длину символа в UTF-8 до одного
От: DenisCh Россия  
Дата: 06.08.11 21:18
Оценка:
Здравствуйте, DOOM, Вы писали:

aik>>Откуда там геморрой если в начале писать что СМС в кои8? Не надо поддерживать пицот кодировок, одной хватит. Выигрыша от юникода я вообще не вижу.

DOO>Ну ты точно тролишь...
DOO>Откуда бНОПНЯ пошло не знаешь что ли? В электронной почте тоже всегда кодировка пишется перед блоком и чо? Редко что ли нечитаемые письма получаешь?

Хм... Я уже очень давно не получал нечитаемых из-за кодировок писем...
... << RSDN@Home 1.2.0 alpha rev. 741>>
Re[10]: Рутенберг ограничит длину символа в UTF-8 до одного
От: aik Австралия  
Дата: 07.08.11 05:17
Оценка: +2 :)
Здравствуйте, 24, Вы писали:

aik>>Ну! Ты не заметил — значит, и другим по барабану, так и надо. А я, например, за границу часто шлю и в роумингах бываю — плюнул бы в рожу тому дебилу что придумал русские буквы юникодить.

24>Лучше тому, кто придумал выставлять такие цены за передачу 140-а байт.

Не соглашусь. Этому гаду надо бы с ноги пробить
Re[10]: Рутенберг ограничит длину символа в UTF-8 до одного
От: aik Австралия  
Дата: 07.08.11 05:25
Оценка:
Здравствуйте, DOOM, Вы писали:

aik>>Откуда там геморрой если в начале писать что СМС в кои8? Не надо поддерживать пицот кодировок, одной хватит. Выигрыша от юникода я вообще не вижу.

DOO>Ну ты точно тролишь...
DOO>Откуда бНОПНЯ пошло не знаешь что ли? В электронной почте тоже всегда кодировка пишется перед блоком и чо? Редко что ли нечитаемые письма получаешь?

Уже и не помню когда последний раз такое было. Лет 5 то точно.

aik>>Ну! Ты не заметил — значит, и другим по барабану, так и надо. А я, например, за границу часто шлю

DOO>Ох я бы полюбовался на тебя как бы ты слал SMS за границу — не будь юникода. Такое ощущение, что вы уже не помните эпоху однобайтного интернета...

Поясни. Шлю с русского телефона на русский телефон. Не вижу откуда возьмутся косяки. Ну, разве что на заре смс куча телефонов рисовала квадратики вместо русских букв — шрифтов не было.

aik>>и в роумингах бываю — плюнул бы в рожу тому дебилу что придумал русские буквы юникодить.

DOO>Ты бы его благословил, если бы подумал еще немного.

Неа. Люди плохо подумали кто за это будет платить. Сначала одни умники сделали 160 символов (мегабайт стоит как героин, ну, ладно, время было такое, технически, наверное, больше нельзя было, хотя уже 2011 год, а длина не меняется), затем другие удвоили цену мегабайта.
Почему то (почему то) латинские СМС ходят в обычном ascii, а не в никаком юникоде. Заговора тут нет, но ситуация требует разруливания, по-моему.
Re[10]: Рутенберг ограничит длину символа в UTF-8 до одного
От: aik Австралия  
Дата: 07.08.11 05:42
Оценка: :)))
Здравствуйте, Centaur, Вы писали:

DOO>>>Она не стоит того, чтобы возвращать геморрой однобайтовых кодировок.

aik>>Откуда там геморрой если в начале писать что СМС в кои8? Не надо поддерживать пицот кодировок, одной хватит. Выигрыша от юникода я вообще не вижу.
C>Не надо поддерживать пицот кодировок, одной хватит. И эта одна должна быть юникодом.

Не нужны вообще кодировки, надо сделать как поступили в DVD с субтитрами — это черно-белые битмапы. Ни тебе кодировок, ни шрифтов, зипануть для компактности — и вопрос закрыт.

Блин надо всегда думать для кого и чего ты делаешь Удобную Кодировку и кто за это потом заплатит. Когда смс стоит 20-40 центов за 80 букв — это начинает конкретно злить, и никакой радости от этой рафинированной юникодной правильности не возникает ни разу. Бить по башке нужно и провайдера, конечно, но сначала то было 160 символов, а уже потом, спустя многие годы, появилось Элегантное Решение проблемы русских букв, игнорирующее текущие расклады цен.
Re[11]: Рутенберг ограничит длину символа в UTF-8 до одного
От: DOOM Россия  
Дата: 07.08.11 06:14
Оценка:
Здравствуйте, DenisCh, Вы писали:

DC>Хм... Я уже очень давно не получал нечитаемых из-за кодировок писем...

DC>
А теперь отгадай почему это вдруг.
Re[11]: Рутенберг ограничит длину символа в UTF-8 до одного
От: DOOM Россия  
Дата: 07.08.11 06:18
Оценка:
Здравствуйте, aik, Вы писали:

aik>Поясни. Шлю с русского телефона на русский телефон. Не вижу откуда возьмутся косяки. Ну, разве что на заре смс куча телефонов рисовала квадратики вместо русских букв — шрифтов не было.

Ты мне тут сам говорил, что шлешь за границу — с чего ты взял, что там будет русский телефон? А может там будет телефон с поддержкой своей национальной кодировки? Прикол многолетней давности с посылкой из Франции не видал? Неужели у многих такая короткая память? Не надо думать, что юникод придумали для изощренных издевательств над людьми.


aik>Почему то (почему то) латинские СМС ходят в обычном ascii, а не в никаком юникоде. Заговора тут нет, но ситуация требует разруливания, по-моему.

Сходи поучи матчасть. В плане UTF-8.
Re[11]: Рутенберг ограничит длину символа в UTF-8 до одного
От: DOOM Россия  
Дата: 07.08.11 06:25
Оценка:
Здравствуйте, aik, Вы писали:

aik>Не нужны вообще кодировки, надо сделать как поступили в DVD с субтитрами — это черно-белые битмапы. Ни тебе кодировок, ни шрифтов, зипануть для компактности — и вопрос закрыт.

Ох как у тебя все просто получается. Т.е. вместо 80 байт текста будем слать 200-300 байт MMS (что явно дороже) и еще обломаем миллиарды легаси телефонов?
К слову, для черно-белых битмапов надо использовать не зип — в сжатии текста как картинки рулит DjVu с его методом сжатия.

aik>Блин надо всегда думать для кого и чего ты делаешь Удобную Кодировку и кто за это потом заплатит. Когда смс стоит 20-40 центов за 80 букв — это начинает конкретно злить, и никакой радости от этой рафинированной юникодной правильности не возникает ни разу.

Но радость возникнет, когда платить будешь в 4 раза больше. Ага.
Re[11]: Рутенберг ограничит длину символа в UTF-8 до одного
От: Centaur Россия  
Дата: 07.08.11 07:49
Оценка:
Здравствуйте, aik, Вы писали:

aik>Не нужны вообще кодировки, надо сделать как поступили в DVD с субтитрами — это черно-белые битмапы. Ни тебе кодировок, ни шрифтов, зипануть для компактности — и вопрос закрыт.


Выдайте кто-нибудь этому человеку медаль «За мегааццкий костыль».

Во-первых, у всех телефонов разный размер экрана, и, в частности, ширина. Ты будешь на маленьком телефоне ползать по SMS’ке, отправленной с iPad’а, и трёхэтажно материться.

Во-вторых, разрешение. Тот шрифт в 6×4px, который нормально читается на стареньком телефоне с полмиллиметровыми пикселями, будет невозможно разглядеть на том же iPad’е.

В-третьих, это просто Изврат. Текст должен передаваться как текст, храниться как текст и обрабатываться как текст. В частности, его должно быть можно отображать любым шрифтом на любой ширине окна, копипейстить, переводить на другие языки, передавать в синтезатор речи.

В-четвёртых, как только ты сделаешь SMS битмэпом, юзеры сразу захотят мочь их рисовать. Можешь начинать писать графический редактор под все телефоны.

В-пятых, как только ты напишешь графический редактор, SMS’ки станут писать. Рукописно. Неразборчиво и нечитаемо. Потому что это быстрее и проще, чем набирать текст через тупой T9.

И т.д. и т.п.

aik>Блин надо всегда думать для кого и чего ты делаешь Удобную Кодировку и кто за это потом заплатит. Когда смс стоит 20-40 центов за 80 букв — это начинает конкретно злить, и никакой радости от этой рафинированной юникодной правильности не возникает ни разу. Бить по башке нужно и провайдера, конечно, но сначала то было 160 символов, а уже потом, спустя многие годы, появилось Элегантное Решение проблемы русских букв, игнорирующее текущие расклады цен.


Можешь продолжать писать транслитом. Он, кстати, похож на КОИ-7, некогда весьма популярную в СССР кодировку.


Вообще же правильное решение состоит в том, что телефон должен предоставлять доступ в Интернет. А уже по этому интернету можно гонять хоть jabber, хоть ssh с X forwarding’ом.
Re[12]: Рутенберг ограничит длину символа в UTF-8 до одного
От: aik Австралия  
Дата: 07.08.11 09:38
Оценка:
Здравствуйте, DOOM, Вы писали:

aik>>Не нужны вообще кодировки, надо сделать как поступили в DVD с субтитрами — это черно-белые битмапы. Ни тебе кодировок, ни шрифтов, зипануть для компактности — и вопрос закрыт.

DOO>Ох как у тебя все просто получается. Т.е. вместо 80 байт текста будем слать 200-300 байт MMS (что явно дороже) и еще обломаем миллиарды легаси телефонов?
DOO>К слову, для черно-белых битмапов надо использовать не зип — в сжатии текста как картинки рулит DjVu с его методом сжатия.

Т.е. ты ничуть не заметил сарказма в моем предложении в битмапами? Вообще?
Так вот — приляпывать юникод при ограничении в 160 символов И ломовой стоимости смс — это ТОЧНО-ТАКАЯ-ЖЕ нездоровая идея.
Re[12]: Рутенберг ограничит длину символа в UTF-8 до одного
От: aik Австралия  
Дата: 07.08.11 09:44
Оценка:
Здравствуйте, DOOM, Вы писали:

aik>>Поясни. Шлю с русского телефона на русский телефон. Не вижу откуда возьмутся косяки. Ну, разве что на заре смс куча телефонов рисовала квадратики вместо русских букв — шрифтов не было.

DOO>Ты мне тут сам говорил, что шлешь за границу — с чего ты взял, что там будет русский телефон? А может там будет телефон с поддержкой своей национальной кодировки? Прикол многолетней давности с посылкой из Франции не видал? Неужели у многих такая короткая память? Не надо думать, что юникод придумали для изощренных издевательств над людьми.

Телефон должен поддерживать русский язык в любом случае — как минимум шрифты должны быть. А, имея шрифт, приляпать декодер koi8 — копеечное дело, гораздо (раз в 50) проще, чем запрограммировать тетрис.

aik>>Почему то (почему то) латинские СМС ходят в обычном ascii, а не в никаком юникоде. Заговора тут нет, но ситуация требует разруливания, по-моему.

DOO>Сходи поучи матчасть. В плане UTF-8.

Сходи поучи тарифные планы сотовых провайдеров, особенно в роуминге. Или gprs/3g роуминга.
Re[12]: Рутенберг ограничит длину символа в UTF-8 до одного
От: aik Австралия  
Дата: 07.08.11 10:00
Оценка: -1
Здравствуйте, Centaur, Вы писали:

aik>>Не нужны вообще кодировки, надо сделать как поступили в DVD с субтитрами — это черно-белые битмапы. Ни тебе кодировок, ни шрифтов, зипануть для компактности — и вопрос закрыт.

C>Выдайте кто-нибудь этому человеку медаль «За мегааццкий костыль».

это был мегаацкий сарказм, который не до всех дошел, как я вижу. ладно, ничо, я подыграю, гыгыгы.

C>Во-первых, у всех телефонов разный размер экрана, и, в частности, ширина. Ты будешь на маленьком телефоне ползать по SMS’ке, отправленной с iPad’а, и трёхэтажно материться.


у меня телефон может показать символов 400 за раз (а еще и скроллинг есть!!!) — какого чорта смс ограничены 160 буквами?!!!

C>Во-вторых, разрешение. Тот шрифт в 6×4px, который нормально читается на стареньком телефоне с полмиллиметровыми пикселями, будет невозможно разглядеть на том же iPad’е.


беда... увеличить картинку вдвое любой идиот сумеет.

C>В-третьих, это просто Изврат. Текст должен передаваться как текст, храниться как текст и обрабатываться как текст. В частности, его должно быть можно отображать любым шрифтом на любой ширине окна, копипейстить, переводить на другие языки, передавать в синтезатор речи.


смс НЕ обрабатывается как текст. весьма редкие телефоны дают выбрать шрифт, о синтезаторе речи можно и не думать.
если уж никого из разработчиков не парит что длина ограничена 80 символами, то и про остальные фичи можно забыть.

C>В-четвёртых, как только ты сделаешь SMS битмэпом, юзеры сразу захотят мочь их рисовать. Можешь начинать писать графический редактор под все телефоны.


отсылка к юзерам — глупая.
они хотят рисовать и без этого. а еще они хотят смс по 500 букв и чтоб эти смс были бесплатные. но куй — предложено тупо драть с русских 2 цены за смс, а русские только и рады заплатить за то же самое вдвое больше — потому что русские круче всех!!!

C>В-пятых, как только ты напишешь графический редактор, SMS’ки станут писать. Рукописно. Неразборчиво и нечитаемо. Потому что это быстрее и проще, чем набирать текст через тупой T9.


сам то пробовал? у меня ноут с нормальным распознавателем рукописного текста — клава все равно удобнее. swype рулит.

C>И т.д. и т.п.

aik>>Блин надо всегда думать для кого и чего ты делаешь Удобную Кодировку и кто за это потом заплатит. Когда смс стоит 20-40 центов за 80 букв — это начинает конкретно злить, и никакой радости от этой рафинированной юникодной правильности не возникает ни разу. Бить по башке нужно и провайдера, конечно, но сначала то было 160 символов, а уже потом, спустя многие годы, появилось Элегантное Решение проблемы русских букв, игнорирующее текущие расклады цен.
C>Можешь продолжать писать транслитом. Он, кстати, похож на КОИ-7, некогда весьма популярную в СССР кодировку.

очень-очень много лет мы живем в 8битном мире. большинство сайтов пашут в windows1251 — и никаких проблем, вообще. никакого транслита не надо. почта уверенно ходит и читается в koi8. даже линуксовые мейлеры это все шикарно поддерживают.

C>Вообще же правильное решение состоит в том, что телефон должен предоставлять доступ в Интернет. А уже по этому интернету можно гонять хоть jabber, хоть ssh с X forwarding’ом.


так ведь мегабайт трафика в роуминге тоже стоит будь здоров. и это _совсем_ другой расход батарейки чем глупая смс.
Re[13]: Рутенберг ограничит длину символа в UTF-8 до одного
От: Cyberax Марс  
Дата: 07.08.11 10:09
Оценка: +2
Здравствуйте, aik, Вы писали:

aik>очень-очень много лет мы живем в 8битном мире. большинство сайтов пашут в windows1251 — и никаких проблем, вообще. никакого транслита не надо. почта уверенно ходит и читается в koi8. даже линуксовые мейлеры это все шикарно поддерживают.

Та що ві ґоворите?

А ещё есть татарский язык, польский и т.д. Использование однобайтных кодировок — чистое создание проблем на свою задницу.
Sapienti sat!
Re[6]: Я вот подумал, зачем так сложно?
От: cencio Украина http://ua-coder.blogspot.com
Дата: 07.08.11 10:20
Оценка:
Здравствуйте, Working Class Hero, Вы писали:

WCH>Здравствуйте, vsb, Вы писали:


vsb>>Принять новый стандарт и обязать следовать ему производителей телефонов, ввозимых в страну и сотовых операторов. Тогда новые телефоны не будут иметь этих ограничений. Для старых телефонов станция будет делать перекодировку.


WCH>Все более-менее современные телефоны поддерживают "склейку" сообщений, т.е. пишешь смс-ку, выходишь за лимит знаков — телефон отправляет длинное сообщение, как последовательность коротких. На принимающем телефоне они должны сшиваться в одно. Насколько я понимаю, в этом случае смс содержит признак, что оно отправляется несколькими частями. Ну и логично вытекающее отсюда решение проблемы — каждые две смс-ки, содержащие кириллицу и признак "склейки", тарифицируются как одно. Пользователи довольны, ФАС довольна, операторы не очень довольны, т.к. лишаются части прибыли, но, по крайней мере, это не самый худший для них вариант.


какой прибыли они лишаются? технически для них не проблема вместо одного такого сообщения хоть десять штук передать и никаких дополнительных расходов на это не нужно.
Re[14]: Рутенберг ограничит длину символа в UTF-8 до одного
От: aik Австралия  
Дата: 07.08.11 10:39
Оценка:
Здравствуйте, Cyberax, Вы писали:

aik>>очень-очень много лет мы живем в 8битном мире. большинство сайтов пашут в windows1251 — и никаких проблем, вообще. никакого транслита не надо. почта уверенно ходит и читается в koi8. даже линуксовые мейлеры это все шикарно поддерживают.

C>Та що ві ґоворите?
C>А ещё есть татарский язык, польский и т.д. Использование однобайтных кодировок — чистое создание проблем на свою задницу.

Не томи — расскажи в чем проблема татар, поляков? Они не могут читать сайты на татарском/польском?

Сдается мне что все проблемы с кодировками были окончательно решены за несколько лет до введения русских смс (2002?) и ссылаться на создание проблем в 2011 году — странно. Причем, в смс можно было оставить по 1 кодировке, и проблемы бы не возникло.

Прошу рассказать какие бонусы дает юникод в смс для юзера.
Re[13]: Рутенберг ограничит длину символа в UTF-8 до одного
От: DOOM Россия  
Дата: 07.08.11 10:45
Оценка: +1
Здравствуйте, aik, Вы писали:

aik>Телефон должен поддерживать русский язык в любом случае — как минимум шрифты должны быть.

Вот тут-то мы и приходим к тому, что проще залить шрифт со всеми нужными глифами (коих не так много, если не рассматривать азиатские языки) и использовать единую кодировку для этого шрифта — юникод.

aik>А, имея шрифт, приляпать декодер koi8 — копеечное дело, гораздо (раз в 50) проще, чем запрограммировать тетрис.

Давай-давай. У нас таких шапкозакидателей хватает. Потом правда выясняется, что не все так просто, что затраты на реализацию таких бредовых идей куда выше, чем отдача от них и т.п.


aik>>>Почему то (почему то) латинские СМС ходят в обычном ascii, а не в никаком юникоде. Заговора тут нет, но ситуация требует разруливания, по-моему.

DOO>>Сходи поучи матчасть. В плане UTF-8.
aik>Сходи поучи тарифные планы сотовых провайдеров, особенно в роуминге. Или gprs/3g роуминга.
Ну вот и борись не с юникодом, а с неадекватной стоимостью услуги по передаче данных.
Re[10]: Рутенберг ограничит длину символа в UTF-8 до одного
От: aik Австралия  
Дата: 07.08.11 10:49
Оценка:
Здравствуйте, Banned by IT, Вы писали:

aik>>Откуда там геморрой если в начале писать что СМС в кои8? Не надо поддерживать пицот кодировок, одной хватит. Выигрыша от юникода я вообще не вижу.

BBI>А потом ещё для всех остальных языков такие подпорки сделать, а потом для собщений в которых несколько языков одновременно а потом опять вернёмся к Unicode.

Еще раз. Мы говорим об СМС. Не о ворде и не о мейлере. Об 160-байтовых СМС, и только о них — потому что там каждый символ стоит очень дорого, если кто не заметил.

С одной стороны — удвоение длины сообщения.
С другой стороны — возможность писать на нескольких языках (большинство пишут на одном, реееедко бывает что латиницу добавляют — 8 бит отлично справляется), значит, видимо, речь о массовой насущной необходимости писать на 3 (трех) языках.

И вторая возможность перевешивает первую?
Я ничего не упускаю?
Re[15]: Рутенберг ограничит длину символа в UTF-8 до одного
От: DOOM Россия  
Дата: 07.08.11 10:49
Оценка:
Здравствуйте, aik, Вы писали:

aik>Здравствуйте, Cyberax, Вы писали:


aik>>>очень-очень много лет мы живем в 8битном мире. большинство сайтов пашут в windows1251 — и никаких проблем, вообще. никакого транслита не надо. почта уверенно ходит и читается в koi8. даже линуксовые мейлеры это все шикарно поддерживают.

C>>Та що ві ґоворите?
C>>А ещё есть татарский язык, польский и т.д. Использование однобайтных кодировок — чистое создание проблем на свою задницу.
aik>Не томи — расскажи в чем проблема татар, поляков? Они не могут читать сайты на татарском/польском?
Да что далеко ходить — предыдущее сообщение Cyberax'а использовало бы 2 однобайтных кодировки — koi8-r и koi8-u. Так что господа украинцы на rsdn уже чувствовали бы себя ограниченными.


aik>Сдается мне что все проблемы с кодировками были окончательно решены за несколько лет до введения русских смс (2002?)

Конечно. Это время, когда юникод наконец-то победил почти везде.

aik>и ссылаться на создание проблем в 2011 году — странно.

Ну и рассуждения у тебя. Если мы какую-то проблему решили много лет назад — это что, значит что надо отказаться от решения в полной уверенности, что проблема не вернется?
Re: Рутенберг ограничит длину символа в UTF-8 до одного байт
От: Uzumaki Naruto Ниоткуда  
Дата: 07.08.11 10:51
Оценка:
Правильный вопрос, почему рассчет цены ведется не посимвольно (посчитать можно), а побайтно...

Re[2]: Рутенберг ограничит длину символа в UTF-8 до одного б
От: Uzumaki Naruto Ниоткуда  
Дата: 07.08.11 10:52
Оценка:
K>А меня больше интересует, почему смски стоят так дорого. Равно как и GPRS.

А еще глянь цену на WAP в твоем регионе, если используется тот же GRPS канал...

Re[15]: Рутенберг ограничит длину символа в UTF-8 до одного
От: Cyberax Марс  
Дата: 07.08.11 10:55
Оценка:
Здравствуйте, aik, Вы писали:

C>>А ещё есть татарский язык, польский и т.д. Использование однобайтных кодировок — чистое создание проблем на свою задницу.

aik>Не томи — расскажи в чем проблема татар, поляков? Они не могут читать сайты на татарском/польском?
Будут проблемы, если ты попробуешь послать сообщение с парой не-KOI-8 символов.

Кстати, из распространённых вещей в KOI-8 отсутствует символ евро.

aik>Сдается мне что все проблемы с кодировками были окончательно решены за несколько лет до введения русских смс (2002?) и ссылаться на создание проблем в 2011 году — странно. Причем, в смс можно было оставить по 1 кодировке, и проблемы бы не возникло.

Проблемы кодировок были решены созданием UTF-8.
Sapienti sat!
Re[16]: Рутенберг ограничит длину символа в UTF-8 до одного
От: aik Австралия  
Дата: 07.08.11 11:20
Оценка:
Здравствуйте, DOOM, Вы писали:


aik>>>>очень-очень много лет мы живем в 8битном мире. большинство сайтов пашут в windows1251 — и никаких проблем, вообще. никакого транслита не надо. почта уверенно ходит и читается в koi8. даже линуксовые мейлеры это все шикарно поддерживают.

C>>>Та що ві ґоворите?
C>>>А ещё есть татарский язык, польский и т.д. Использование однобайтных кодировок — чистое создание проблем на свою задницу.
aik>>Не томи — расскажи в чем проблема татар, поляков? Они не могут читать сайты на татарском/польском?
DOO>Да что далеко ходить — предыдущее сообщение Cyberax'а использовало бы 2 однобайтных кодировки — koi8-r и koi8-u. Так что господа украинцы на rsdn уже чувствовали бы себя ограниченными.

И? Двухбайтового тага "переключение кодировки на такую то" хватило бы.

aik>>Сдается мне что все проблемы с кодировками были окончательно решены за несколько лет до введения русских смс (2002?)

DOO>Конечно. Это время, когда юникод наконец-то победил почти везде.

gazeta.ru, bash.org.ru, gov.ru, rbc.ru, lenta.ru — windows1251. У кого то есть проблемы с чтением этих сайтов?
Открыл почту — все что из гугль-мейла пришло — uft8, все остальное — koi8r, но читается все прекрасно.
До полной победы еще не дошли. Кстати, побеждает utf8, а не utf16 (которая в мобилах), т.е. кодировок даже тут две разных, хотя и несильно.

aik>>и ссылаться на создание проблем в 2011 году — странно.

DOO>Ну и рассуждения у тебя. Если мы какую-то проблему решили много лет назад — это что, значит что надо отказаться от решения в полной уверенности, что проблема не вернется?

Мои рассуждения такие что решать проблему кодировки СМС без учета стоимости каждой буквы — категорически неверно.
Re[11]: Рутенберг ограничит длину символа в UTF-8 до одного
От: trickster Россия  
Дата: 07.08.11 11:21
Оценка:
Здравствуйте, aik, Вы писали:

aik>Здравствуйте, Banned by IT, Вы писали:


aik>>>Откуда там геморрой если в начале писать что СМС в кои8? Не надо поддерживать пицот кодировок, одной хватит. Выигрыша от юникода я вообще не вижу.

BBI>>А потом ещё для всех остальных языков такие подпорки сделать, а потом для собщений в которых несколько языков одновременно а потом опять вернёмся к Unicode.

aik>Еще раз. Мы говорим об СМС. Не о ворде и не о мейлере. Об 160-байтовых СМС, и только о них — потому что там каждый символ стоит очень дорого, если кто не заметил.


aik>С одной стороны — удвоение длины сообщения.

aik>С другой стороны — возможность писать на нескольких языках (большинство пишут на одном, реееедко бывает что латиницу добавляют — 8 бит отлично справляется), значит, видимо, речь о массовой насущной необходимости писать на 3 (трех) языках.

aik>И вторая возможность перевешивает первую?

aik>Я ничего не упускаю?

с третий стороны универсальный стандарт, позволяющий людям из разных стран общаться друг с другом через смс, обсалютно не заботясь, что в koi8-r нету недостающих символов
Re[17]: Рутенберг ограничит длину символа в UTF-8 до одного
От: trickster Россия  
Дата: 07.08.11 11:25
Оценка:
Здравствуйте, aik, Вы писали:

aik>Здравствуйте, DOOM, Вы писали:


aik>gazeta.ru, bash.org.ru, gov.ru, rbc.ru, lenta.ru — windows1251. У кого то есть проблемы с чтением этих сайтов?

aik>Открыл почту — все что из гугль-мейла пришло — uft8, все остальное — koi8r, но читается все прекрасно.
aik>До полной победы еще не дошли. Кстати, побеждает utf8, а не utf16 (которая в мобилах), т.е. кодировок даже тут две разных, хотя и несильно.

во внутренностях винды тоже совсем не utf-8 используется.
насчет сайтов стоит сказать что это русскоязычные сайты и интересно будет посмотреть как они справятся если вдруг понадобится вставить текст на каком-нибудь другом языке.. ах да, не получится, cp1251 же...
Re[17]: Рутенберг ограничит длину символа в UTF-8 до одного
От: trickster Россия  
Дата: 07.08.11 11:28
Оценка:
Здравствуйте, aik, Вы писали:

aik>Здравствуйте, DOOM, Вы писали:



aik>>>>>очень-очень много лет мы живем в 8битном мире. большинство сайтов пашут в windows1251 — и никаких проблем, вообще. никакого транслита не надо. почта уверенно ходит и читается в koi8. даже линуксовые мейлеры это все шикарно поддерживают.

C>>>>Та що ві ґоворите?
C>>>>А ещё есть татарский язык, польский и т.д. Использование однобайтных кодировок — чистое создание проблем на свою задницу.
aik>>>Не томи — расскажи в чем проблема татар, поляков? Они не могут читать сайты на татарском/польском?
DOO>>Да что далеко ходить — предыдущее сообщение Cyberax'а использовало бы 2 однобайтных кодировки — koi8-r и koi8-u. Так что господа украинцы на rsdn уже чувствовали бы себя ограниченными.

aik>И? Двухбайтового тага "переключение кодировки на такую то" хватило бы.


то-есть уже все равно что они нормально ничего не прочтут, зато повод добавить очередной костыль!
Re[12]: Рутенберг ограничит длину символа в UTF-8 до одного
От: aik Австралия  
Дата: 07.08.11 11:35
Оценка:
Здравствуйте, trickster, Вы писали:

T>с третий стороны универсальный стандарт, позволяющий людям из разных стран общаться друг с другом через смс, обсалютно не заботясь, что в koi8-r нету недостающих символов


Это же очень просто прикинуть кого больше — кому 70 символов мало и кому не хватает символов в koi8. Просто с позиций здравого смысла.
Деньги в роуминге никогда не заканчивались?
Re[13]: Рутенберг ограничит длину символа в UTF-8 до одного
От: trickster Россия  
Дата: 07.08.11 11:40
Оценка:
Здравствуйте, aik, Вы писали:

aik>Здравствуйте, trickster, Вы писали:


T>>с третий стороны универсальный стандарт, позволяющий людям из разных стран общаться друг с другом через смс, обсалютно не заботясь, что в koi8-r нету недостающих символов


aik>Это же очень просто прикинуть кого больше — кому 70 символов мало и кому не хватает символов в koi8. Просто с позиций здравого смысла.


китайцев больше будет.
а как вы вообще представляет сиё? телефон определяет какая кодировка (ну или пользователь выбирает) и читаем? интересно как перепрошить для этого все телефоны находящиеся в РФ?
Re[17]: Рутенберг ограничит длину символа в UTF-8 до одного
От: DOOM Россия  
Дата: 07.08.11 11:48
Оценка:
Здравствуйте, aik, Вы писали:

aik>И? Двухбайтового тага "переключение кодировки на такую то" хватило бы.

И как бы ты его вводил? Это ж человеку придется делать. К тому же, уж больно сложным становится текст — а искать в нем как?


aik>До полной победы еще не дошли. Кстати, побеждает utf8, а не utf16 (которая в мобилах), т.е. кодировок даже тут две разных, хотя и несильно.

Если бы в мобилах была UTF-16, тогда бы вопросов не было — потому что там и английские символы два байта занимают — открой reg файл в каком-нибудь редакторе, не понимающем юникод и убедишься.

aik>Мои рассуждения такие что решать проблему кодировки СМС без учета стоимости каждой буквы — категорически неверно.

Ну вот и пусть решают проблему стоимости SMS — она надуманная. Нет таких накладных расходов на пересылку информации, сколько пытается поиметь оператор.
Re[18]: Рутенберг ограничит длину символа в UTF-8 до одного
От: trickster Россия  
Дата: 07.08.11 11:51
Оценка:
Здравствуйте, DOOM, Вы писали:

DOO>Здравствуйте, aik, Вы писали:


aik>>До полной победы еще не дошли. Кстати, побеждает utf8, а не utf16 (которая в мобилах), т.е. кодировок даже тут две разных, хотя и несильно.

DOO>Если бы в мобилах была UTF-16, тогда бы вопросов не было — потому что там и английские символы два байта занимают — открой reg файл в каком-нибудь редакторе, не понимающем юникод и убедишься.

это есть даже в русский википедии, для английского там ascii => макс 160 символов, для латинских (франц, нем) 8 байтовая кодировка => 140 символов, для всех остальных utf-16
Re[16]: Рутенберг ограничит длину символа в UTF-8 до одного
От: Cyberax Марс  
Дата: 07.08.11 12:31
Оценка:
Здравствуйте, Cyberax, Вы писали:

C>Кстати, из распространённых вещей в KOI-8 отсутствует символ евро.

Что характерно, символа рубля там тоже нет.
Sapienti sat!
Re[11]: Рутенберг ограничит длину символа в UTF-8 до одного
От: Banned by IT  
Дата: 07.08.11 12:56
Оценка:
Здравствуйте, aik, Вы писали:

aik>Поясни. Шлю с русского телефона на русский телефон. Не вижу откуда возьмутся косяки. Ну, разве что на заре смс куча телефонов рисовала квадратики вместо русских букв — шрифтов не было.

Ты в курсе что GSM стандарт он международный. И нет там такого понятия как "русский телефон".
... << RSDN@Home 1.1.4 stable SR1 rev. 568>>
Забанили по IP, значит пора закрыть эту страницу.
Всем пока
Re: Рутенберг ограничит длину символа в UTF-8 до одного байт
От: ZOI4  
Дата: 07.08.11 13:05
Оценка:
Здравствуйте, Skleroz,

Кончится все тем, что ушлые операторы переведут смс-ки на UTF-16, а то и на UTF-32 8)
Мафиозная диктатура это нестабильность. Если не мафиозная диктатура, то Конституция и демократия.
Re[12]: Рутенберг ограничит длину символа в UTF-8 до одного
От: DenisCh Россия  
Дата: 07.08.11 14:22
Оценка:
Здравствуйте, DOOM, Вы писали:

DC>>Хм... Я уже очень давно не получал нечитаемых из-за кодировок писем...

DC>>
DOO>А теперь отгадай почему это вдруг.

Лень думать и гадать. Твоя версия?
... << RSDN@Home 1.2.0 alpha rev. 741>>
Re[3]: Рутенберг ограничит длину символа в UTF-8 до одного б
От: Klatu  
Дата: 07.08.11 15:32
Оценка:
Здравствуйте, Uzumaki Naruto, Вы писали:

UN>А еще глянь цену на WAP в твоем регионе, если используется тот же GRPS канал...


Да я в курсе, там маразм еще круче. А ты знаешь, сколько стоит GPRS в Таиланде? Попробуй догадаться?
.
.
.
.
.
.
.
.
.
.
.
5 рублей за час, ха-ха.
Re[2]: Рутенберг ограничит длину символа в UTF-8 до одного б
От: elmal  
Дата: 07.08.11 19:05
Оценка:
Здравствуйте, Uzumaki Naruto, Вы писали:

UN>Правильный вопрос, почему рассчет цены ведется не посимвольно (посчитать можно), а побайтно...

Рассчет цены ведется попакетно, вообще то . Побайтовости даже близко нет.
Re[14]: Рутенберг ограничит длину символа в UTF-8 до одного
От: aik Австралия  
Дата: 08.08.11 00:57
Оценка:
Здравствуйте, trickster, Вы писали:

T>>>с третий стороны универсальный стандарт, позволяющий людям из разных стран общаться друг с другом через смс, обсалютно не заботясь, что в koi8-r нету недостающих символов

aik>>Это же очень просто прикинуть кого больше — кому 70 символов мало и кому не хватает символов в koi8. Просто с позиций здравого смысла.
T>китайцев больше будет.

Т.е. когда я переплачиваю в роуминге — я должен радоваться за китайцев?

T>а как вы вообще представляет сиё? телефон определяет какая кодировка (ну или пользователь выбирает) и читаем? интересно как перепрошить для этого все телефоны находящиеся в РФ?


Сейчас уже понятно что решение строго одно будет (если оно вообще будет) — провайдеров заставят чарджить за русские смс вполовину, если их ушло несколько на склейку.

Я возмущался про начальное решение.
Re[18]: Рутенберг ограничит длину символа в UTF-8 до одного
От: aik Австралия  
Дата: 08.08.11 01:02
Оценка:
Здравствуйте, DOOM, Вы писали:

aik>>И? Двухбайтового тага "переключение кодировки на такую то" хватило бы.

DOO>И как бы ты его вводил?

Человек все равно выбирает язык на котором печатать — из менюшки.

DOO>Это ж человеку придется делать. К тому же, уж больно сложным становится текст — а искать в нем как?


Искать среди 140 символов? Там можно потеряться?

aik>>До полной победы еще не дошли. Кстати, побеждает utf8, а не utf16 (которая в мобилах), т.е. кодировок даже тут две разных, хотя и несильно.

DOO>Если бы в мобилах была UTF-16, тогда бы вопросов не было — потому что там и английские символы два байта занимают — открой reg файл в каком-нибудь редакторе, не понимающем юникод и убедишься.

Я не могу в мобиле открыть реестр. Насколько я понимаю, стоит в тексте появится одной русской букве — все, вся смс будет в utf16 (ucs2).

aik>>Мои рассуждения такие что решать проблему кодировки СМС без учета стоимости каждой буквы — категорически неверно.

DOO>Ну вот и пусть решают проблему стоимости SMS — она надуманная. Нет таких накладных расходов на пересылку информации, сколько пытается поиметь оператор.

Прошло лет 10 — и не подумали даже решать, только народ переплатил за Красоту Решения.
Re[12]: Рутенберг ограничит длину символа в UTF-8 до одного
От: aik Австралия  
Дата: 08.08.11 01:04
Оценка:
Здравствуйте, Banned by IT, Вы писали:

aik>>Поясни. Шлю с русского телефона на русский телефон. Не вижу откуда возьмутся косяки. Ну, разве что на заре смс куча телефонов рисовала квадратики вместо русских букв — шрифтов не было.

BBI>Ты в курсе что GSM стандарт он международный. И нет там такого понятия как "русский телефон".

Пириважу на руски езык. "русский телефон" означает "телефон с поддержкой русского языка в виде наличия шрифтов и, опционально, клавиатуры".
Re[3]: Рутенберг ограничит длину символа в UTF-8 до одного б
От: DOOM Россия  
Дата: 08.08.11 02:45
Оценка:
Здравствуйте, elmal, Вы писали:

E>Рассчет цены ведется попакетно, вообще то . Побайтовости даже близко нет.

А вот тут можно попробовать на нарушение правил минсвязи в части биллинга выйти
Надо только понять к какой услуге связи относится передача SMS...
Re[6]: Рутенберг ограничит длину символа в UTF-8 до одного б
От: sambl4 Россия  
Дата: 08.08.11 04:44
Оценка:
Здравствуйте, Working Class Hero, Вы писали:

vsb>>Принять новый стандарт и обязать следовать ему производителей телефонов, ввозимых в страну и сотовых операторов. Тогда новые телефоны не будут иметь этих ограничений. Для старых телефонов станция будет делать перекодировку.


WCH>Вопросов много возникает. Достаточно ли для выполнения перкодировки "на лету" апгрейда программного обеспечения оборудования оператора? Или надо менять часть оборудования? Кто будет платить за все это (потребитель не хочет, в виде повышенных тарифов, ясное дело)? В конце-концов, что ФАС предлагает делать с имеющимися сотовыми телефонами, которые при отправке СМС на русском сами бьют его на части, если превышен порог в 60 символов? Считать две такие смс-ки как одну?


А так и надо только сделать — всего-то ввести тарификацию СМС в зависимости от контента. При грабительских ценах на смс запас у них ого-го какой.
Re[19]: Рутенберг ограничит длину символа в UTF-8 до одного
От: Sinix  
Дата: 08.08.11 04:50
Оценка:
Здравствуйте, trickster, Вы писали:

T>для всех остальных utf-16

Вообще-то UCS-2.
Re: Рутенберг ограничит длину символа в UTF-8 до одного байт
От: Micht  
Дата: 08.08.11 05:03
Оценка: 1 (1) +1
Здравствуйте, Skleroz, Вы писали:

S>http://www.finmarket.ru/z/nws/hotnews.asp?id=2312349


Стандарт GSM описывает такую интересную кодировку как "Packed UCS-2". Занимает в два раза меньше места, чем просто UCS-2 (плюс пара байт на заголовок и страницу). Но почему-то именно в SMS (и только) она не используется.

З.Ы. Даже костылей никаких не надо, всё уже придумано...
Re[5]: Рутенберг ограничит длину символа в UTF-8 до одного б
От: qwertyuiop Российская Империя  
Дата: 08.08.11 07:24
Оценка: +1
Здравствуйте, vsb, Вы писали:

WCH>>Осталось только понять, как заставить понимать KOI-8 миллионы телефонов, выпущенных на сегодняшний день.


vsb>Принять новый стандарт


Жаль что нет оценки "повбывав бы!"

Смысл слова "стандарт" в том, что он должен быть один. А за мою жизнь поменялось уже столько стандартов кодировки, что их уже нельзя называть стандартами. Если еще и антимонопольщики будут вводить свои стандарты, то можно повеситься!
Я отвечаю за свои слова, а не за то как вы их интерпретируете!
Re[6]: Рутенберг ограничит длину символа в UTF-8 до одного б
От: vsb Казахстан  
Дата: 08.08.11 08:02
Оценка:
Здравствуйте, qwertyuiop, Вы писали:

Q>Здравствуйте, vsb, Вы писали:


WCH>>>Осталось только понять, как заставить понимать KOI-8 миллионы телефонов, выпущенных на сегодняшний день.


vsb>>Принять новый стандарт


Q>Жаль что нет оценки "повбывав бы!"


Q>Смысл слова "стандарт" в том, что он должен быть один. А за мою жизнь поменялось уже столько стандартов кодировки, что их уже нельзя называть стандартами. Если еще и антимонопольщики будут вводить свои стандарты, то можно повеситься!


Он и будет один. Только разные версии. Это нормально в современном мире. Редко получается всё сделать как надо с первого раза.

А те стандарты, которые не меняются в соответствие с требованиями времени — отмирают как неактуальные.
Re[12]: Рутенберг ограничит длину символа в UTF-8 до одного
От: 4UBAKA  
Дата: 08.08.11 15:31
Оценка:
Здравствуйте, DOOM, Вы писали:

aik>>Почему то (почему то) латинские СМС ходят в обычном ascii, а не в никаком юникоде. Заговора тут нет, но ситуация требует разруливания, по-моему.

DOO>Сходи поучи матчасть. В плане UTF-8.

Это всё англичанка гадит )))
Re[14]: Рутенберг ограничит длину символа в UTF-8 до одного
От: Ночной Смотрящий Россия  
Дата: 08.08.11 16:40
Оценка:
Здравствуйте, DOOM, Вы писали:

DOO>Вот тут-то мы и приходим к тому, что проще залить шрифт со всеми нужными глифами (коих не так много, если не рассматривать азиатские языки) и использовать единую кодировку для этого шрифта — юникод.


Стандарт юникода содержит не одну UTF-8. Есть еще, к примеру, SCSU или BOCU-1.
Re[12]: Рутенберг ограничит длину символа в UTF-8 до одного
От: Ночной Смотрящий Россия  
Дата: 08.08.11 16:43
Оценка:
Здравствуйте, Centaur, Вы писали:

C>Во-первых, у всех телефонов разный размер экрана, и, в частности, ширина. Ты будешь на маленьком телефоне ползать по SMS’ке, отправленной с iPad’а, и трёхэтажно материться.


iPad не умеет отправлять СМСки
Re[15]: Рутенберг ограничит длину символа в UTF-8 до одного
От: DOOM Россия  
Дата: 08.08.11 17:13
Оценка:
Здравствуйте, Ночной Смотрящий, Вы писали:

НС>Стандарт юникода содержит не одну UTF-8. Есть еще, к примеру, SCSU или BOCU-1.

Ну мне казалось, что UTF-8 — самый компактный вариант... Поправь, если ошибался.
Re[16]: Рутенберг ограничит длину символа в UTF-8 до одного
От: Ночной Смотрящий Россия  
Дата: 08.08.11 17:48
Оценка:
Здравствуйте, DOOM, Вы писали:

НС>>Стандарт юникода содержит не одну UTF-8. Есть еще, к примеру, SCSU или BOCU-1.

DOO>Ну мне казалось, что UTF-8 — самый компактный вариант... Поправь, если ошибался.

Тебе казалось. Ключевые слова, которые я привел, прекрасно гуглятся.
Re[13]: Рутенберг ограничит длину символа в UTF-8 до одного
От: Sharowarsheg  
Дата: 08.08.11 19:10
Оценка:
Здравствуйте, aik, Вы писали:

DOO>>Ты мне тут сам говорил, что шлешь за границу — с чего ты взял, что там будет русский телефон? А может там будет телефон с поддержкой своей национальной кодировки? Прикол многолетней давности с посылкой из Франции не видал? Неужели у многих такая короткая память? Не надо думать, что юникод придумали для изощренных издевательств над людьми.


aik>Телефон должен поддерживать русский язык в любом случае — как минимум шрифты должны быть. А, имея шрифт, приляпать декодер koi8 — копеечное дело, гораздо (раз в 50) проще, чем запрограммировать тетрис.


Приляпать декодер в мой телефон будет мне стоить как новый телефон. Копеечное дело, но непонятно, нафига бы мне это надо, меня вполне устраивает имеющийся.
Re: Название темы как заголовок из желтой прессы
От: igna Россия  
Дата: 09.08.11 13:15
Оценка:
Здравствуйте, Skleroz, Вы писали:

S>http://www.finmarket.ru/z/nws/hotnews.asp?id=2312349


Где же там про "ограничит длину символа в UTF-8 до одного байта"?
Re: Рутенберг ограничит длину символа в UTF-8 до одного байт
От: Kerk  
Дата: 09.08.11 15:08
Оценка: +1
Интересно, если бы на заре массового телеграфа буква "Б" в сообщении стоила бы в 2 раза дороже буквы "А" (в азбуке Морзе она длиннее кодируется), у этого тоже нашлось бы столько защитников?
Re[7]: Рутенберг ограничит длину символа в UTF-8 до одного б
От: qwertyuiop Российская Империя  
Дата: 09.08.11 15:55
Оценка: :)
Здравствуйте, vsb, Вы писали:

vsb>Он и будет один. Только разные версии.


Разные версии — это как раз и означает, что он не один!

vsb>Это нормально в современном мире. Редко получается всё сделать как надо с первого раза.


Ты знаешь сколько таких разов было?

1) Кодировка ЕС-ХХХХ
2) Кодировка СМ-4
3) Две кодировки ЕС-1840 (IBM-PC) — основная (о которой сейчас никто не знает) и альтернативная (ныне известная как ДОСовская)
4) КОИ-8
4) Виндовская кодировка
5) Наконец, появился Юникод, призванный заменить все имеющиеся кодировки на одну. Но не успел он появиться, как сразу стали появляться его модификации которых сейчас стало больше, чем было кодировок до него!
И наверняка я еще что-то пропустил.

vsb>А те стандарты, которые не меняются в соответствие с требованиями времени — отмирают как неактуальные.


Стандарт не может меняться!!! Потому что он — стандарт. Предствь себе, что сейчас решат поменять стандарт на CD-диски. Или на шины PCI. Или на напряжение в бытовой сети. Как тебе такие "соответствия с требованиями времени"? А поменять стандарт кодировки — ну подумаешь, какая мелочь, да хоть сейчас!
Я отвечаю за свои слова, а не за то как вы их интерпретируете!
Re[8]: Рутенберг ограничит длину символа в UTF-8 до одного б
От: pzhy  
Дата: 09.08.11 16:38
Оценка:
Здравствуйте, qwertyuiop, Вы писали:

Q>Стандарт не может меняться!!! Потому что он — стандарт. Предствь себе, что сейчас решат поменять стандарт на CD-диски. Или на шины PCI. Или на напряжение в бытовой сети. Как тебе такие "соответствия с требованиями времени"? А поменять стандарт кодировки — ну подумаешь, какая мелочь, да хоть сейчас!


Ну водители Владивостока, вполне себе пользуются, другим стандартом, и очень не понимают, почему нельзя) Но, это — шутка. Могу привести пример из реальной жизни когда стандарты разных стран, повергают людей в очень необаснованные траты. Газовые котлы, — знакомый решил сэкономить, привез себе бошевский из польши, а он раз 10 зимой просто отключался. Срабатывала автоматика, считая что тот уровень газа, кот. поступает — это нет газа. Замена автоматики (она не программируема), не сильно ниже всей цене котла. Просто в Польше, давление газа регламентируется сандартом намного жестче чем у нас. Вот такая вот экономия... Я это к чему, невозможно, во всех обласях жизнедеятельности, разработать стандарты, на все случаи жизни...
Re[2]: Название темы как заголовок из желтой прессы
От: Skleroz Россия  
Дата: 10.08.11 02:28
Оценка:
I>Где же там про "ограничит длину символа в UTF-8 до одного байта"?

Этот топик изначально постился в юмор.
Re[9]: Рутенберг ограничит длину символа в UTF-8 до одного б
От: qwertyuiop Российская Империя  
Дата: 10.08.11 07:21
Оценка:
Здравствуйте, pzhy, Вы писали:

P><...> Я это к чему


Не знаю к чему это вы. Доказательство методом аналогии не есть доказательство.

P>невозможно, во всех обласях жизнедеятельности, разработать стандарты, на все случаи жизни...


Здесь речь идет не обо всех областях жизнедеятельности, а о кодировке символов. И она таки да, должна быть одна на все случаи жизни.
Я отвечаю за свои слова, а не за то как вы их интерпретируете!
Re[8]: Рутенберг ограничит длину символа в UTF-8 до одного б
От: vsb Казахстан  
Дата: 12.08.11 13:53
Оценка:
Здравствуйте, qwertyuiop, Вы писали:

Q>Здравствуйте, vsb, Вы писали:


vsb>>А те стандарты, которые не меняются в соответствие с требованиями времени — отмирают как неактуальные.


Q>Стандарт не может меняться!!! Потому что он — стандарт. Предствь себе, что сейчас решат поменять стандарт на CD-диски.


DVD, HD-DVD, Blueray?

> Или на шины PCI.


PCI Express? Вроде уже ещё один придумали.

> А поменять стандарт кодировки — ну подумаешь, какая мелочь, да хоть сейчас!


Согласен, мелочь.
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.