Здравствуйте, vsb, Вы писали:
vsb>Я имею в виду те буквы, которые не отличаются: AАBВEЕKКMМHНOОPРCСTТXХaаeеoоpрcсyуxх
То есть ещё и коды маленьких и больших будут нерегулярно связаы?
Может ну её лесом, эту реформу?
Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском
Здравствуйте, Mamut, Вы писали:
vsb>>Я имею в виду те буквы, которые не отличаются: AАBВEЕKКMМHНOОPРCСTТXХaаeеoоpрcсyуxх
M>И? То, что они не отличаются в компьютерных шрифтах, говорит только о том, что компьютеры в целом убили понятие типографики.
Ну и ладно.
M>И, вдобавок, у тебя внезапно на ровном месте появляется дополнительные сложности для обработки таких текстов:
M>- B это заглавная от б или b? M>- T это заглавная от t или т? M>- P — это «эр» или «пэ»?
Не представляю задач, когда мне это может понадобиться.
M>Это не говоря о диком усложнении программ на ровном месте.
Нет никакого усложнения. Всё остаётся ровно так же, как сейчас (если нормально поддерживать интернационализацию, а не только для русского и английского).
M>При том, что уже сейчас средний программист не может нормально обработать ситуации с «ё»: https://i.imgur.com/SMv1728.png
А в моём варианте сможет. Это "удобная" русская кодировка провоцирует писать такой код. Не было бы её, не было бы такого кода.
M>Это не говоря о том, что у тебя исключительно «западный» взгляд на вещи. Предлагаешь, например, так же объединить:
M>- Փ ARMENIAN CAPITAL LETTER PIWR M>- օ ARMENIAN SMALL LETTER OH M>- ০ BENGALI DIGIT ZERO M>- ৪ BENGALI DIGIT FOUR M>- 𑄽 CHAKMA DIGIT SEVEN M>- ᱛ OL CHIKI LETTER AT M>- ᳃ SUNDANESE PUNCTUATION BINDU CAKRA M>- ᩅ TAI THAM LETTER WA M>- ቀ ETHIOPIC SYLLABLE QA M>- Ᏼ CHEROKEE LETTER YV M>- Ꭲ CHEROKEE LETTER I M>- Ꭼ CHEROKEE LETTER GV M>- Ꭺ CHEROKEE LETTER GO
Думаю, каждый случай нужно рассматривать отдельно. В целом да, если два символа рисуются идентично, они должны использовать один код. Ещё, кстати, букву "ё" как букву с отдельным кодом тоже надо выкинуть. Правильная ё должна получаться через "е" + U+0308: "ё".
Здравствуйте, Erop, Вы писали:
vsb>>Я имею в виду те буквы, которые не отличаются: AАBВEЕKКMМHНOОPРCСTТXХaаeеoоpрcсyуxх
E>То есть ещё и коды маленьких и больших будут нерегулярно связаы?
Да, так же, как и в некоторых других языках.
E>Может ну её лесом, эту реформу?
Здравствуйте, pagid, Вы писали:
P>То есть прописные "Т" должны совпадать, а строчные "т" и "t" быть разными. Это просто праздник какой-то получится.
Почему только Т?
Hh vs Нн
Rr vs Гг
Yy vs Уу
И это ещё без курсивных написаний. Там "Т" может и рекордсмен по путанице будет
Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском
Здравствуйте, Mihas, Вы писали:
M>Где-то я такое уже видел. Русские буквы насильно заменялись латинскими, если начертание совпадает. M>Уж не с оформлением ли паспорта было связано...
Был под MS-DOS какой-то дебильный, но популярный редактор, который некоторые коды русских букв использовал, как служебный символы, для какой-то разметки, что ли. И там эти буквы были как раз такие, что у них были латинские "близнецы". И при локализации на русский, ничего умнее не придумали, чем автоматом заменять в русских текстах Н на H
Я помню, даже специальную программку накропал, что бы эти замены в русских словах находить и обратно тексты "расколдовывать"
Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском
Здравствуйте, vsb, Вы писали:
vsb>PS моё предложение хорошо ещё тем, что научило бы русских программистов правильно работать с юникодом.
История показывает, что насильно учить русских чему-то, чему они учиться не хотят -- занятие пустое, и чреватое гибелью от меча...
Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском
Здравствуйте, Cyberax, Вы писали:
P>>То есть прописные "Т" должны совпадать, а строчные "т" и "t" быть разными. Это просто праздник какой-то получится. C>В турецком именно так, строчная i в заглавной форме — İ.
Вот хрень какая-то и вышла. А была бы у турок своя и такая и своя и сякая. И было бы им счастье...
Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском
Здравствуйте, Mamut, Вы писали:
M>А какие решения ты предложишь? В турецком «и-с-точкой» (читается как «и») и «и-без-точки» (читается, как «ы») — две абсолютно разные буквы, со всем вытекающим.
Ну иметь ДВЕ турецкие буквы "турецкая и с точкой" и "турецкая и без точки", так же, как есть русская О, латинская O, и ещё 0 в придачу...
Или есть латинская l и 1
Почему было и туркам не завести ДВЕ новые свои буквы и не страдать с перекодировками и сменами регистра?
Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском
Здравствуйте, vsb, Вы писали:
vsb>К примеру в казахском языке используются русские буквы плюс 9 своих, никто эти русские буквы в таблице символов не дублирует. Вроде бы то же самое относится к европейским языкам, там тоже используются латинские буквы + несколько своих.
Кайне проблемен. Как только смёржишь 0 с латинской O большой и 1 с латинской l малой, так сразу и приходи.
Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском
Здравствуйте, Mihas, Вы писали:
M>Здравствуйте, vsb, Вы писали:
M>Где-то я такое уже видел. Русские буквы насильно заменялись латинскими, если начертание совпадает.
В FIDO?!
M>>При том, что уже сейчас средний программист не может нормально обработать ситуации с «ё»: https://i.imgur.com/SMv1728.png
vsb>А в моём варианте сможет. Это "удобная" русская кодировка провоцирует писать такой код. Не было бы её, не было бы такого кода.
Расскажи, как твой вариант помог бы. У тебя же буквы будут рандомно раскиданы повсюду.
M>>А какие решения ты предложишь? В турецком «и-с-точкой» (читается как «и») и «и-без-точки» (читается, как «ы») — две абсолютно разные буквы, со всем вытекающим.
E>Ну иметь ДВЕ турецкие буквы "турецкая и с точкой" и "турецкая и без точки", так же, как есть русская О, латинская O, и ещё 0 в придачу... E>Или есть латинская l и 1
Да, это было бы решением.
E>Почему было и туркам не завести ДВЕ новые свои буквы и не страдать с перекодировками и сменами регистра?
Здравствуйте, Mamut, Вы писали:
M>Не турки это вводили
А вот это хороший ответ.
В отличии от турок, кириллические-то кодировки вводили советские, так как было удобно им, а не американцам
Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском
Здравствуйте, vsb, Вы писали:
vsb>К примеру в казахском языке используются русские буквы плюс 9 своих, никто эти русские буквы в таблице символов не дублирует. Вроде бы то же самое относится к европейским языкам, там тоже используются латинские буквы + несколько своих.
Подумал тут вот о чем.
А зачем заглавным буквам отдельные коды?
Ведь по большому счету, 'a' и 'A' это одна и та же буква.
А то что буква заглавная — это лишь вариант начертания, ничем не отличающийся от таких вариантов как bold, italic, underline, subscript, superscript и т.д. У italic шрифтов для некоторых букв начертание может отличаться даже сильнее, чем у заглавной от строчной.
По сути, заглавные буквы — это наследие ASCII, когда не было еще разделения между символами и кодовыми точками.
Заглавные буквы это особенность европейских языков. В китайских и других иероглифах заглавных букв нет.
Но в тех же европейских языках была "буквица" — когда первая буква главы писалась еще более крупным шрифтом и даже украшалась. Это явление того же порядка что и заглавные буквы как таковые, просто следующий уровень.
Нет такого преступления, на которое не пошло бы суверенное родоплеменное быдло ради продления своего бессмысленного рода и распространения своего бессмысленного генома.
Здравствуйте, Mamut, Вы писали:
M>>>При том, что уже сейчас средний программист не может нормально обработать ситуации с «ё»: https://i.imgur.com/SMv1728.png
vsb>>А в моём варианте сможет. Это "удобная" русская кодировка провоцирует писать такой код. Не было бы её, не было бы такого кода.
M>Расскажи, как твой вариант помог бы. У тебя же буквы будут рандомно раскиданы повсюду.
Помог бы тем, что наивный код вида 'А' <= ch && ch <= 'Я' не сработал бы сразу и разработчику сразу пришлось бы думать о правильном подходе.
M>>Расскажи, как твой вариант помог бы. У тебя же буквы будут рандомно раскиданы повсюду.
vsb>Помог бы тем, что наивный код вида 'А' <= ch && ch <= 'Я' не сработал бы сразу и разработчику сразу пришлось бы думать о правильном подходе.
Ну и расскажи мне, каким будет правильный подход в условиях, когда буквы рандомно раскиданы по всему алфавиту?
Здравствуйте, Mamut, Вы писали:
M>>>Расскажи, как твой вариант помог бы. У тебя же буквы будут рандомно раскиданы повсюду.
vsb>>Помог бы тем, что наивный код вида 'А' <= ch && ch <= 'Я' не сработал бы сразу и разработчику сразу пришлось бы думать о правильном подходе.
M>Ну и расскажи мне, каким будет правильный подход в условиях, когда буквы рандомно раскиданы по всему алфавиту?
vsb>>>Помог бы тем, что наивный код вида 'А' <= ch && ch <= 'Я' не сработал бы сразу и разработчику сразу пришлось бы думать о правильном подходе.
M>>Ну и расскажи мне, каким будет правильный подход в условиях, когда буквы рандомно раскиданы по всему алфавиту?
vsb>
Здравствуйте, Mamut, Вы писали:
vsb>>>>Помог бы тем, что наивный код вида 'А' <= ch && ch <= 'Я' не сработал бы сразу и разработчику сразу пришлось бы думать о правильном подходе.
M>>>Ну и расскажи мне, каким будет правильный подход в условиях, когда буквы рандомно раскиданы по всему алфавиту?
vsb>>
M>То есть ты предлагаешь вручную вбивать весь алфавит?
Ну вообще я рассчитывал, что в Java это есть из коробки, но не нашёл. Возможно надо подключить библиотеку ICU, лень смотреть, никогда с ней не работал.
> Ладно, простейший случай ты криво, но решил.
Здравствуйте, Mamut, Вы писали:
M>И? То, что они не отличаются в компьютерных шрифтах, говорит только о том, что компьютеры в целом убили понятие типографики. И, вдобавок, у тебя внезапно на ровном месте появляется дополнительные сложности для обработки таких текстов:
Логичный Юникод можно было бы делать двумя фундаментально разными способами:
1. Объединить графически одинаковые символы в одном коде. Затем для преобразования строчных в прописные буквы использовать языково-специфичные таблицы (которые всё равно нужны).
2. Разделить каждый национальный алфавит в свой диапазон. Т.е. чтобы польская A отличалась от латинской A, а китайский "喝" отличался от японского "喝" (который я даже сюда скопировать не могу, оно заменяется на китайский).
Но в итоге получилась смесь всего со всем, в которой нереально разобраться без пары кубов очень крепкого наркотика.