Re[10]: Рутенберг ограничит длину символа в UTF-8 до одного
От: aik Австралия  
Дата: 07.08.11 05:17
Оценка: +2 :)
Здравствуйте, 24, Вы писали:

aik>>Ну! Ты не заметил — значит, и другим по барабану, так и надо. А я, например, за границу часто шлю и в роумингах бываю — плюнул бы в рожу тому дебилу что придумал русские буквы юникодить.

24>Лучше тому, кто придумал выставлять такие цены за передачу 140-а байт.

Не соглашусь. Этому гаду надо бы с ноги пробить
Re[10]: Рутенберг ограничит длину символа в UTF-8 до одного
От: aik Австралия  
Дата: 07.08.11 05:25
Оценка:
Здравствуйте, DOOM, Вы писали:

aik>>Откуда там геморрой если в начале писать что СМС в кои8? Не надо поддерживать пицот кодировок, одной хватит. Выигрыша от юникода я вообще не вижу.

DOO>Ну ты точно тролишь...
DOO>Откуда бНОПНЯ пошло не знаешь что ли? В электронной почте тоже всегда кодировка пишется перед блоком и чо? Редко что ли нечитаемые письма получаешь?

Уже и не помню когда последний раз такое было. Лет 5 то точно.

aik>>Ну! Ты не заметил — значит, и другим по барабану, так и надо. А я, например, за границу часто шлю

DOO>Ох я бы полюбовался на тебя как бы ты слал SMS за границу — не будь юникода. Такое ощущение, что вы уже не помните эпоху однобайтного интернета...

Поясни. Шлю с русского телефона на русский телефон. Не вижу откуда возьмутся косяки. Ну, разве что на заре смс куча телефонов рисовала квадратики вместо русских букв — шрифтов не было.

aik>>и в роумингах бываю — плюнул бы в рожу тому дебилу что придумал русские буквы юникодить.

DOO>Ты бы его благословил, если бы подумал еще немного.

Неа. Люди плохо подумали кто за это будет платить. Сначала одни умники сделали 160 символов (мегабайт стоит как героин, ну, ладно, время было такое, технически, наверное, больше нельзя было, хотя уже 2011 год, а длина не меняется), затем другие удвоили цену мегабайта.
Почему то (почему то) латинские СМС ходят в обычном ascii, а не в никаком юникоде. Заговора тут нет, но ситуация требует разруливания, по-моему.
Re[10]: Рутенберг ограничит длину символа в UTF-8 до одного
От: aik Австралия  
Дата: 07.08.11 05:42
Оценка: :)))
Здравствуйте, Centaur, Вы писали:

DOO>>>Она не стоит того, чтобы возвращать геморрой однобайтовых кодировок.

aik>>Откуда там геморрой если в начале писать что СМС в кои8? Не надо поддерживать пицот кодировок, одной хватит. Выигрыша от юникода я вообще не вижу.
C>Не надо поддерживать пицот кодировок, одной хватит. И эта одна должна быть юникодом.

Не нужны вообще кодировки, надо сделать как поступили в DVD с субтитрами — это черно-белые битмапы. Ни тебе кодировок, ни шрифтов, зипануть для компактности — и вопрос закрыт.

Блин надо всегда думать для кого и чего ты делаешь Удобную Кодировку и кто за это потом заплатит. Когда смс стоит 20-40 центов за 80 букв — это начинает конкретно злить, и никакой радости от этой рафинированной юникодной правильности не возникает ни разу. Бить по башке нужно и провайдера, конечно, но сначала то было 160 символов, а уже потом, спустя многие годы, появилось Элегантное Решение проблемы русских букв, игнорирующее текущие расклады цен.
Re[11]: Рутенберг ограничит длину символа в UTF-8 до одного
От: DOOM Россия  
Дата: 07.08.11 06:14
Оценка:
Здравствуйте, DenisCh, Вы писали:

DC>Хм... Я уже очень давно не получал нечитаемых из-за кодировок писем...

DC>
А теперь отгадай почему это вдруг.
Re[11]: Рутенберг ограничит длину символа в UTF-8 до одного
От: DOOM Россия  
Дата: 07.08.11 06:18
Оценка:
Здравствуйте, aik, Вы писали:

aik>Поясни. Шлю с русского телефона на русский телефон. Не вижу откуда возьмутся косяки. Ну, разве что на заре смс куча телефонов рисовала квадратики вместо русских букв — шрифтов не было.

Ты мне тут сам говорил, что шлешь за границу — с чего ты взял, что там будет русский телефон? А может там будет телефон с поддержкой своей национальной кодировки? Прикол многолетней давности с посылкой из Франции не видал? Неужели у многих такая короткая память? Не надо думать, что юникод придумали для изощренных издевательств над людьми.


aik>Почему то (почему то) латинские СМС ходят в обычном ascii, а не в никаком юникоде. Заговора тут нет, но ситуация требует разруливания, по-моему.

Сходи поучи матчасть. В плане UTF-8.
Re[11]: Рутенберг ограничит длину символа в UTF-8 до одного
От: DOOM Россия  
Дата: 07.08.11 06:25
Оценка:
Здравствуйте, aik, Вы писали:

aik>Не нужны вообще кодировки, надо сделать как поступили в DVD с субтитрами — это черно-белые битмапы. Ни тебе кодировок, ни шрифтов, зипануть для компактности — и вопрос закрыт.

Ох как у тебя все просто получается. Т.е. вместо 80 байт текста будем слать 200-300 байт MMS (что явно дороже) и еще обломаем миллиарды легаси телефонов?
К слову, для черно-белых битмапов надо использовать не зип — в сжатии текста как картинки рулит DjVu с его методом сжатия.

aik>Блин надо всегда думать для кого и чего ты делаешь Удобную Кодировку и кто за это потом заплатит. Когда смс стоит 20-40 центов за 80 букв — это начинает конкретно злить, и никакой радости от этой рафинированной юникодной правильности не возникает ни разу.

Но радость возникнет, когда платить будешь в 4 раза больше. Ага.
Re[11]: Рутенберг ограничит длину символа в UTF-8 до одного
От: Centaur Россия  
Дата: 07.08.11 07:49
Оценка:
Здравствуйте, aik, Вы писали:

aik>Не нужны вообще кодировки, надо сделать как поступили в DVD с субтитрами — это черно-белые битмапы. Ни тебе кодировок, ни шрифтов, зипануть для компактности — и вопрос закрыт.


Выдайте кто-нибудь этому человеку медаль «За мегааццкий костыль».

Во-первых, у всех телефонов разный размер экрана, и, в частности, ширина. Ты будешь на маленьком телефоне ползать по SMS’ке, отправленной с iPad’а, и трёхэтажно материться.

Во-вторых, разрешение. Тот шрифт в 6×4px, который нормально читается на стареньком телефоне с полмиллиметровыми пикселями, будет невозможно разглядеть на том же iPad’е.

В-третьих, это просто Изврат. Текст должен передаваться как текст, храниться как текст и обрабатываться как текст. В частности, его должно быть можно отображать любым шрифтом на любой ширине окна, копипейстить, переводить на другие языки, передавать в синтезатор речи.

В-четвёртых, как только ты сделаешь SMS битмэпом, юзеры сразу захотят мочь их рисовать. Можешь начинать писать графический редактор под все телефоны.

В-пятых, как только ты напишешь графический редактор, SMS’ки станут писать. Рукописно. Неразборчиво и нечитаемо. Потому что это быстрее и проще, чем набирать текст через тупой T9.

И т.д. и т.п.

aik>Блин надо всегда думать для кого и чего ты делаешь Удобную Кодировку и кто за это потом заплатит. Когда смс стоит 20-40 центов за 80 букв — это начинает конкретно злить, и никакой радости от этой рафинированной юникодной правильности не возникает ни разу. Бить по башке нужно и провайдера, конечно, но сначала то было 160 символов, а уже потом, спустя многие годы, появилось Элегантное Решение проблемы русских букв, игнорирующее текущие расклады цен.


Можешь продолжать писать транслитом. Он, кстати, похож на КОИ-7, некогда весьма популярную в СССР кодировку.


Вообще же правильное решение состоит в том, что телефон должен предоставлять доступ в Интернет. А уже по этому интернету можно гонять хоть jabber, хоть ssh с X forwarding’ом.
Re[12]: Рутенберг ограничит длину символа в UTF-8 до одного
От: aik Австралия  
Дата: 07.08.11 09:38
Оценка:
Здравствуйте, DOOM, Вы писали:

aik>>Не нужны вообще кодировки, надо сделать как поступили в DVD с субтитрами — это черно-белые битмапы. Ни тебе кодировок, ни шрифтов, зипануть для компактности — и вопрос закрыт.

DOO>Ох как у тебя все просто получается. Т.е. вместо 80 байт текста будем слать 200-300 байт MMS (что явно дороже) и еще обломаем миллиарды легаси телефонов?
DOO>К слову, для черно-белых битмапов надо использовать не зип — в сжатии текста как картинки рулит DjVu с его методом сжатия.

Т.е. ты ничуть не заметил сарказма в моем предложении в битмапами? Вообще?
Так вот — приляпывать юникод при ограничении в 160 символов И ломовой стоимости смс — это ТОЧНО-ТАКАЯ-ЖЕ нездоровая идея.
Re[12]: Рутенберг ограничит длину символа в UTF-8 до одного
От: aik Австралия  
Дата: 07.08.11 09:44
Оценка:
Здравствуйте, DOOM, Вы писали:

aik>>Поясни. Шлю с русского телефона на русский телефон. Не вижу откуда возьмутся косяки. Ну, разве что на заре смс куча телефонов рисовала квадратики вместо русских букв — шрифтов не было.

DOO>Ты мне тут сам говорил, что шлешь за границу — с чего ты взял, что там будет русский телефон? А может там будет телефон с поддержкой своей национальной кодировки? Прикол многолетней давности с посылкой из Франции не видал? Неужели у многих такая короткая память? Не надо думать, что юникод придумали для изощренных издевательств над людьми.

Телефон должен поддерживать русский язык в любом случае — как минимум шрифты должны быть. А, имея шрифт, приляпать декодер koi8 — копеечное дело, гораздо (раз в 50) проще, чем запрограммировать тетрис.

aik>>Почему то (почему то) латинские СМС ходят в обычном ascii, а не в никаком юникоде. Заговора тут нет, но ситуация требует разруливания, по-моему.

DOO>Сходи поучи матчасть. В плане UTF-8.

Сходи поучи тарифные планы сотовых провайдеров, особенно в роуминге. Или gprs/3g роуминга.
Re[12]: Рутенберг ограничит длину символа в UTF-8 до одного
От: aik Австралия  
Дата: 07.08.11 10:00
Оценка: -1
Здравствуйте, Centaur, Вы писали:

aik>>Не нужны вообще кодировки, надо сделать как поступили в DVD с субтитрами — это черно-белые битмапы. Ни тебе кодировок, ни шрифтов, зипануть для компактности — и вопрос закрыт.

C>Выдайте кто-нибудь этому человеку медаль «За мегааццкий костыль».

это был мегаацкий сарказм, который не до всех дошел, как я вижу. ладно, ничо, я подыграю, гыгыгы.

C>Во-первых, у всех телефонов разный размер экрана, и, в частности, ширина. Ты будешь на маленьком телефоне ползать по SMS’ке, отправленной с iPad’а, и трёхэтажно материться.


у меня телефон может показать символов 400 за раз (а еще и скроллинг есть!!!) — какого чорта смс ограничены 160 буквами?!!!

C>Во-вторых, разрешение. Тот шрифт в 6×4px, который нормально читается на стареньком телефоне с полмиллиметровыми пикселями, будет невозможно разглядеть на том же iPad’е.


беда... увеличить картинку вдвое любой идиот сумеет.

C>В-третьих, это просто Изврат. Текст должен передаваться как текст, храниться как текст и обрабатываться как текст. В частности, его должно быть можно отображать любым шрифтом на любой ширине окна, копипейстить, переводить на другие языки, передавать в синтезатор речи.


смс НЕ обрабатывается как текст. весьма редкие телефоны дают выбрать шрифт, о синтезаторе речи можно и не думать.
если уж никого из разработчиков не парит что длина ограничена 80 символами, то и про остальные фичи можно забыть.

C>В-четвёртых, как только ты сделаешь SMS битмэпом, юзеры сразу захотят мочь их рисовать. Можешь начинать писать графический редактор под все телефоны.


отсылка к юзерам — глупая.
они хотят рисовать и без этого. а еще они хотят смс по 500 букв и чтоб эти смс были бесплатные. но куй — предложено тупо драть с русских 2 цены за смс, а русские только и рады заплатить за то же самое вдвое больше — потому что русские круче всех!!!

C>В-пятых, как только ты напишешь графический редактор, SMS’ки станут писать. Рукописно. Неразборчиво и нечитаемо. Потому что это быстрее и проще, чем набирать текст через тупой T9.


сам то пробовал? у меня ноут с нормальным распознавателем рукописного текста — клава все равно удобнее. swype рулит.

C>И т.д. и т.п.

aik>>Блин надо всегда думать для кого и чего ты делаешь Удобную Кодировку и кто за это потом заплатит. Когда смс стоит 20-40 центов за 80 букв — это начинает конкретно злить, и никакой радости от этой рафинированной юникодной правильности не возникает ни разу. Бить по башке нужно и провайдера, конечно, но сначала то было 160 символов, а уже потом, спустя многие годы, появилось Элегантное Решение проблемы русских букв, игнорирующее текущие расклады цен.
C>Можешь продолжать писать транслитом. Он, кстати, похож на КОИ-7, некогда весьма популярную в СССР кодировку.

очень-очень много лет мы живем в 8битном мире. большинство сайтов пашут в windows1251 — и никаких проблем, вообще. никакого транслита не надо. почта уверенно ходит и читается в koi8. даже линуксовые мейлеры это все шикарно поддерживают.

C>Вообще же правильное решение состоит в том, что телефон должен предоставлять доступ в Интернет. А уже по этому интернету можно гонять хоть jabber, хоть ssh с X forwarding’ом.


так ведь мегабайт трафика в роуминге тоже стоит будь здоров. и это _совсем_ другой расход батарейки чем глупая смс.
Re[13]: Рутенберг ограничит длину символа в UTF-8 до одного
От: Cyberax Марс  
Дата: 07.08.11 10:09
Оценка: +2
Здравствуйте, aik, Вы писали:

aik>очень-очень много лет мы живем в 8битном мире. большинство сайтов пашут в windows1251 — и никаких проблем, вообще. никакого транслита не надо. почта уверенно ходит и читается в koi8. даже линуксовые мейлеры это все шикарно поддерживают.

Та що ві ґоворите?

А ещё есть татарский язык, польский и т.д. Использование однобайтных кодировок — чистое создание проблем на свою задницу.
Sapienti sat!
Re[6]: Я вот подумал, зачем так сложно?
От: cencio Украина http://ua-coder.blogspot.com
Дата: 07.08.11 10:20
Оценка:
Здравствуйте, Working Class Hero, Вы писали:

WCH>Здравствуйте, vsb, Вы писали:


vsb>>Принять новый стандарт и обязать следовать ему производителей телефонов, ввозимых в страну и сотовых операторов. Тогда новые телефоны не будут иметь этих ограничений. Для старых телефонов станция будет делать перекодировку.


WCH>Все более-менее современные телефоны поддерживают "склейку" сообщений, т.е. пишешь смс-ку, выходишь за лимит знаков — телефон отправляет длинное сообщение, как последовательность коротких. На принимающем телефоне они должны сшиваться в одно. Насколько я понимаю, в этом случае смс содержит признак, что оно отправляется несколькими частями. Ну и логично вытекающее отсюда решение проблемы — каждые две смс-ки, содержащие кириллицу и признак "склейки", тарифицируются как одно. Пользователи довольны, ФАС довольна, операторы не очень довольны, т.к. лишаются части прибыли, но, по крайней мере, это не самый худший для них вариант.


какой прибыли они лишаются? технически для них не проблема вместо одного такого сообщения хоть десять штук передать и никаких дополнительных расходов на это не нужно.
Re[14]: Рутенберг ограничит длину символа в UTF-8 до одного
От: aik Австралия  
Дата: 07.08.11 10:39
Оценка:
Здравствуйте, Cyberax, Вы писали:

aik>>очень-очень много лет мы живем в 8битном мире. большинство сайтов пашут в windows1251 — и никаких проблем, вообще. никакого транслита не надо. почта уверенно ходит и читается в koi8. даже линуксовые мейлеры это все шикарно поддерживают.

C>Та що ві ґоворите?
C>А ещё есть татарский язык, польский и т.д. Использование однобайтных кодировок — чистое создание проблем на свою задницу.

Не томи — расскажи в чем проблема татар, поляков? Они не могут читать сайты на татарском/польском?

Сдается мне что все проблемы с кодировками были окончательно решены за несколько лет до введения русских смс (2002?) и ссылаться на создание проблем в 2011 году — странно. Причем, в смс можно было оставить по 1 кодировке, и проблемы бы не возникло.

Прошу рассказать какие бонусы дает юникод в смс для юзера.
Re[13]: Рутенберг ограничит длину символа в UTF-8 до одного
От: DOOM Россия  
Дата: 07.08.11 10:45
Оценка: +1
Здравствуйте, aik, Вы писали:

aik>Телефон должен поддерживать русский язык в любом случае — как минимум шрифты должны быть.

Вот тут-то мы и приходим к тому, что проще залить шрифт со всеми нужными глифами (коих не так много, если не рассматривать азиатские языки) и использовать единую кодировку для этого шрифта — юникод.

aik>А, имея шрифт, приляпать декодер koi8 — копеечное дело, гораздо (раз в 50) проще, чем запрограммировать тетрис.

Давай-давай. У нас таких шапкозакидателей хватает. Потом правда выясняется, что не все так просто, что затраты на реализацию таких бредовых идей куда выше, чем отдача от них и т.п.


aik>>>Почему то (почему то) латинские СМС ходят в обычном ascii, а не в никаком юникоде. Заговора тут нет, но ситуация требует разруливания, по-моему.

DOO>>Сходи поучи матчасть. В плане UTF-8.
aik>Сходи поучи тарифные планы сотовых провайдеров, особенно в роуминге. Или gprs/3g роуминга.
Ну вот и борись не с юникодом, а с неадекватной стоимостью услуги по передаче данных.
Re[10]: Рутенберг ограничит длину символа в UTF-8 до одного
От: aik Австралия  
Дата: 07.08.11 10:49
Оценка:
Здравствуйте, Banned by IT, Вы писали:

aik>>Откуда там геморрой если в начале писать что СМС в кои8? Не надо поддерживать пицот кодировок, одной хватит. Выигрыша от юникода я вообще не вижу.

BBI>А потом ещё для всех остальных языков такие подпорки сделать, а потом для собщений в которых несколько языков одновременно а потом опять вернёмся к Unicode.

Еще раз. Мы говорим об СМС. Не о ворде и не о мейлере. Об 160-байтовых СМС, и только о них — потому что там каждый символ стоит очень дорого, если кто не заметил.

С одной стороны — удвоение длины сообщения.
С другой стороны — возможность писать на нескольких языках (большинство пишут на одном, реееедко бывает что латиницу добавляют — 8 бит отлично справляется), значит, видимо, речь о массовой насущной необходимости писать на 3 (трех) языках.

И вторая возможность перевешивает первую?
Я ничего не упускаю?
Re[15]: Рутенберг ограничит длину символа в UTF-8 до одного
От: DOOM Россия  
Дата: 07.08.11 10:49
Оценка:
Здравствуйте, aik, Вы писали:

aik>Здравствуйте, Cyberax, Вы писали:


aik>>>очень-очень много лет мы живем в 8битном мире. большинство сайтов пашут в windows1251 — и никаких проблем, вообще. никакого транслита не надо. почта уверенно ходит и читается в koi8. даже линуксовые мейлеры это все шикарно поддерживают.

C>>Та що ві ґоворите?
C>>А ещё есть татарский язык, польский и т.д. Использование однобайтных кодировок — чистое создание проблем на свою задницу.
aik>Не томи — расскажи в чем проблема татар, поляков? Они не могут читать сайты на татарском/польском?
Да что далеко ходить — предыдущее сообщение Cyberax'а использовало бы 2 однобайтных кодировки — koi8-r и koi8-u. Так что господа украинцы на rsdn уже чувствовали бы себя ограниченными.


aik>Сдается мне что все проблемы с кодировками были окончательно решены за несколько лет до введения русских смс (2002?)

Конечно. Это время, когда юникод наконец-то победил почти везде.

aik>и ссылаться на создание проблем в 2011 году — странно.

Ну и рассуждения у тебя. Если мы какую-то проблему решили много лет назад — это что, значит что надо отказаться от решения в полной уверенности, что проблема не вернется?
Re: Рутенберг ограничит длину символа в UTF-8 до одного байт
От: Uzumaki Naruto Ниоткуда  
Дата: 07.08.11 10:51
Оценка:
Правильный вопрос, почему рассчет цены ведется не посимвольно (посчитать можно), а побайтно...

Re[2]: Рутенберг ограничит длину символа в UTF-8 до одного б
От: Uzumaki Naruto Ниоткуда  
Дата: 07.08.11 10:52
Оценка:
K>А меня больше интересует, почему смски стоят так дорого. Равно как и GPRS.

А еще глянь цену на WAP в твоем регионе, если используется тот же GRPS канал...

Re[15]: Рутенберг ограничит длину символа в UTF-8 до одного
От: Cyberax Марс  
Дата: 07.08.11 10:55
Оценка:
Здравствуйте, aik, Вы писали:

C>>А ещё есть татарский язык, польский и т.д. Использование однобайтных кодировок — чистое создание проблем на свою задницу.

aik>Не томи — расскажи в чем проблема татар, поляков? Они не могут читать сайты на татарском/польском?
Будут проблемы, если ты попробуешь послать сообщение с парой не-KOI-8 символов.

Кстати, из распространённых вещей в KOI-8 отсутствует символ евро.

aik>Сдается мне что все проблемы с кодировками были окончательно решены за несколько лет до введения русских смс (2002?) и ссылаться на создание проблем в 2011 году — странно. Причем, в смс можно было оставить по 1 кодировке, и проблемы бы не возникло.

Проблемы кодировок были решены созданием UTF-8.
Sapienti sat!
Re[16]: Рутенберг ограничит длину символа в UTF-8 до одного
От: aik Австралия  
Дата: 07.08.11 11:20
Оценка:
Здравствуйте, DOOM, Вы писали:


aik>>>>очень-очень много лет мы живем в 8битном мире. большинство сайтов пашут в windows1251 — и никаких проблем, вообще. никакого транслита не надо. почта уверенно ходит и читается в koi8. даже линуксовые мейлеры это все шикарно поддерживают.

C>>>Та що ві ґоворите?
C>>>А ещё есть татарский язык, польский и т.д. Использование однобайтных кодировок — чистое создание проблем на свою задницу.
aik>>Не томи — расскажи в чем проблема татар, поляков? Они не могут читать сайты на татарском/польском?
DOO>Да что далеко ходить — предыдущее сообщение Cyberax'а использовало бы 2 однобайтных кодировки — koi8-r и koi8-u. Так что господа украинцы на rsdn уже чувствовали бы себя ограниченными.

И? Двухбайтового тага "переключение кодировки на такую то" хватило бы.

aik>>Сдается мне что все проблемы с кодировками были окончательно решены за несколько лет до введения русских смс (2002?)

DOO>Конечно. Это время, когда юникод наконец-то победил почти везде.

gazeta.ru, bash.org.ru, gov.ru, rbc.ru, lenta.ru — windows1251. У кого то есть проблемы с чтением этих сайтов?
Открыл почту — все что из гугль-мейла пришло — uft8, все остальное — koi8r, но читается все прекрасно.
До полной победы еще не дошли. Кстати, побеждает utf8, а не utf16 (которая в мобилах), т.е. кодировок даже тут две разных, хотя и несильно.

aik>>и ссылаться на создание проблем в 2011 году — странно.

DOO>Ну и рассуждения у тебя. Если мы какую-то проблему решили много лет назад — это что, значит что надо отказаться от решения в полной уверенности, что проблема не вернется?

Мои рассуждения такие что решать проблему кодировки СМС без учета стоимости каждой буквы — категорически неверно.
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.