Re[10]: А зачем русским буквам отдельные символы? - Компьютерные священные войны

Re[3]: А зачем русским буквам отдельные символы?

	От:	Erop
	Дата:	11.04.20 23:51
	Оценка:

Здравствуйте, vsb, Вы писали:

vsb>Я имею в виду те буквы, которые не отличаются: AАBВEЕKКMМHНOОPРCСTТXХaаeеoоpрcсyуxх

То есть ещё и коды маленьких и больших будут нерегулярно связаы?
Может ну её лесом, эту реформу?

Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском

Re[4]: А зачем русским буквам отдельные символы?

	От:	vsb
	Дата:	11.04.20 23:58
	Оценка:

Здравствуйте, Mamut, Вы писали:

vsb>>Я имею в виду те буквы, которые не отличаются: AАBВEЕKКMМHНOОPРCСTТXХaаeеoоpрcсyуxх

M>И? То, что они не отличаются в компьютерных шрифтах, говорит только о том, что компьютеры в целом убили понятие типографики.

Ну и ладно.

M>И, вдобавок, у тебя внезапно на ровном месте появляется дополнительные сложности для обработки таких текстов:

M>- B это заглавная от б или b?
M>- T это заглавная от t или т?
M>- P — это «эр» или «пэ»?

Не представляю задач, когда мне это может понадобиться.

M>Это не говоря о диком усложнении программ на ровном месте.

Нет никакого усложнения. Всё остаётся ровно так же, как сейчас (если нормально поддерживать интернационализацию, а не только для русского и английского).

M>При том, что уже сейчас средний программист не может нормально обработать ситуации с «ё»: https://i.imgur.com/SMv1728.png

А в моём варианте сможет. Это "удобная" русская кодировка провоцирует писать такой код. Не было бы её, не было бы такого кода.

M>Это не говоря о том, что у тебя исключительно «западный» взгляд на вещи. Предлагаешь, например, так же объединить:

M>- Փ ARMENIAN CAPITAL LETTER PIWR
M>- օ ARMENIAN SMALL LETTER OH
M>- ০ BENGALI DIGIT ZERO
M>- ৪ BENGALI DIGIT FOUR
M>- 𑄽 CHAKMA DIGIT SEVEN
M>- ᱛ OL CHIKI LETTER AT
M>- ᳃ SUNDANESE PUNCTUATION BINDU CAKRA
M>- ᩅ TAI THAM LETTER WA
M>- ቀ ETHIOPIC SYLLABLE QA
M>- Ᏼ CHEROKEE LETTER YV
M>- Ꭲ CHEROKEE LETTER I
M>- Ꭼ CHEROKEE LETTER GV
M>- Ꭺ CHEROKEE LETTER GO

Думаю, каждый случай нужно рассматривать отдельно. В целом да, если два символа рисуются идентично, они должны использовать один код. Ещё, кстати, букву "ё" как букву с отдельным кодом тоже надо выкинуть. Правильная ё должна получаться через "е" + U+0308: "ё".

Re[4]: А зачем русским буквам отдельные символы?

	От:	vsb
	Дата:	11.04.20 23:59
	Оценка:

Здравствуйте, Erop, Вы писали:

vsb>>Я имею в виду те буквы, которые не отличаются: AАBВEЕKКMМHНOОPРCСTТXХaаeеoоpрcсyуxх

E>То есть ещё и коды маленьких и больших будут нерегулярно связаы?

Да, так же, как и в некоторых других языках.

E>Может ну её лесом, эту реформу?

Ну понятно, что это надо было делать изначально.

Re[2]: А зачем русским буквам отдельные символы?

	От:	Erop
	Дата:	12.04.20 00:00
	Оценка:

Здравствуйте, pagid, Вы писали:

P>То есть прописные "Т" должны совпадать, а строчные "т" и "t" быть разными. Это просто праздник какой-то получится.

Почему только Т?

Hh vs Нн
Rr vs Гг
Yy vs Уу

И это ещё без курсивных написаний. Там "Т" может и рекордсмен по путанице будет

Re[2]: А зачем русским буквам отдельные символы?

	От:	Erop
	Дата:	12.04.20 00:05
	Оценка:	+1

Здравствуйте, Mihas, Вы писали:

M>Где-то я такое уже видел. Русские буквы насильно заменялись латинскими, если начертание совпадает.
M>Уж не с оформлением ли паспорта было связано...

Был под MS-DOS какой-то дебильный, но популярный редактор, который некоторые коды русских букв использовал, как служебный символы, для какой-то разметки, что ли. И там эти буквы были как раз такие, что у них были латинские "близнецы". И при локализации на русский, ничего умнее не придумали, чем автоматом заменять в русских текстах Н на H

Я помню, даже специальную программку накропал, что бы эти замены в русских словах находить и обратно тексты "расколдовывать"

Отредактировано 12.04.2020 12:17 Erop . Предыдущая версия .

Re[3]: А зачем русским буквам отдельные символы?

	От:	Erop
	Дата:	12.04.20 00:07
	Оценка:

Здравствуйте, vsb, Вы писали:

vsb>PS моё предложение хорошо ещё тем, что научило бы русских программистов правильно работать с юникодом.

История показывает, что насильно учить русских чему-то, чему они учиться не хотят -- занятие пустое, и чреватое гибелью от меча...

Re[3]: А зачем русским буквам отдельные символы?

	От:	Erop
	Дата:	12.04.20 00:09
	Оценка:

Здравствуйте, Cyberax, Вы писали:

P>>То есть прописные "Т" должны совпадать, а строчные "т" и "t" быть разными. Это просто праздник какой-то получится.
C>В турецком именно так, строчная i в заглавной форме — İ.

Вот хрень какая-то и вышла. А была бы у турок своя и такая и своя и сякая. И было бы им счастье...

Re[5]: А зачем русским буквам отдельные символы?

	От:	Erop
	Дата:	12.04.20 00:12
	Оценка:

Здравствуйте, Mamut, Вы писали:

M>А какие решения ты предложишь? В турецком «и-с-точкой» (читается как «и») и «и-без-точки» (читается, как «ы») — две абсолютно разные буквы, со всем вытекающим.

Ну иметь ДВЕ турецкие буквы "турецкая и с точкой" и "турецкая и без точки", так же, как есть русская О, латинская O, и ещё 0 в придачу...
Или есть латинская l и 1
Почему было и туркам не завести ДВЕ новые свои буквы и не страдать с перекодировками и сменами регистра?

Re: А зачем русским буквам отдельные символы?

	От:	Erop
	Дата:	12.04.20 00:19
	Оценка:

Re[2]: А зачем русским буквам отдельные символы?

	От:	Poopy Joe
	Дата:	12.04.20 09:04
	Оценка:

Здравствуйте, Mihas, Вы писали:

M>Здравствуйте, vsb, Вы писали:

M>Где-то я такое уже видел. Русские буквы насильно заменялись латинскими, если начертание совпадает.
В FIDO?!

Re[5]: А зачем русским буквам отдельные символы?

От:	Mamut	http://dmitriid.com
Дата:	12.04.20 09:10
Оценка:

M>>При том, что уже сейчас средний программист не может нормально обработать ситуации с «ё»: https://i.imgur.com/SMv1728.png

vsb>А в моём варианте сможет. Это "удобная" русская кодировка провоцирует писать такой код. Не было бы её, не было бы такого кода.

Расскажи, как твой вариант помог бы. У тебя же буквы будут рандомно раскиданы повсюду.

dmitriid.com … GitHub … LinkedIn

Re[6]: А зачем русским буквам отдельные символы?

От:	Mamut	http://dmitriid.com
Дата:	12.04.20 09:10
Оценка:

M>>А какие решения ты предложишь? В турецком «и-с-точкой» (читается как «и») и «и-без-точки» (читается, как «ы») — две абсолютно разные буквы, со всем вытекающим.

E>Ну иметь ДВЕ турецкие буквы "турецкая и с точкой" и "турецкая и без точки", так же, как есть русская О, латинская O, и ещё 0 в придачу...
E>Или есть латинская l и 1

Да, это было бы решением.

E>Почему было и туркам не завести ДВЕ новые свои буквы и не страдать с перекодировками и сменами регистра?

Не турки это вводили

dmitriid.com … GitHub … LinkedIn

Re[7]: А зачем русским буквам отдельные символы?

	От:	Erop
	Дата:	12.04.20 12:10
	Оценка:

Здравствуйте, Mamut, Вы писали:

M>Не турки это вводили

А вот это хороший ответ.
В отличии от турок, кириллические-то кодировки вводили советские, так как было удобно им, а не американцам

Re: А зачем русским буквам отдельные символы?

От:	anonymouse2	Либерал Глобалист Безбожник Трансгуманист
Дата:	12.04.20 13:04
Оценка:

Здравствуйте, vsb, Вы писали:

vsb>К примеру в казахском языке используются русские буквы плюс 9 своих, никто эти русские буквы в таблице символов не дублирует. Вроде бы то же самое относится к европейским языкам, там тоже используются латинские буквы + несколько своих.

Подумал тут вот о чем.
А зачем заглавным буквам отдельные коды?
Ведь по большому счету, 'a' и 'A' это одна и та же буква.
А то что буква заглавная — это лишь вариант начертания, ничем не отличающийся от таких вариантов как bold, italic, underline, subscript, superscript и т.д. У italic шрифтов для некоторых букв начертание может отличаться даже сильнее, чем у заглавной от строчной.

По сути, заглавные буквы — это наследие ASCII, когда не было еще разделения между символами и кодовыми точками.
Заглавные буквы это особенность европейских языков. В китайских и других иероглифах заглавных букв нет.
Но в тех же европейских языках была "буквица" — когда первая буква главы писалась еще более крупным шрифтом и даже украшалась. Это явление того же порядка что и заглавные буквы как таковые, просто следующий уровень.

Нет такого преступления, на которое не пошло бы суверенное родоплеменное быдло ради продления своего бессмысленного рода и распространения своего бессмысленного генома.

Re[6]: А зачем русским буквам отдельные символы?

	От:	vsb
	Дата:	12.04.20 13:23
	Оценка:

Здравствуйте, Mamut, Вы писали:

M>>>При том, что уже сейчас средний программист не может нормально обработать ситуации с «ё»: https://i.imgur.com/SMv1728.png

vsb>>А в моём варианте сможет. Это "удобная" русская кодировка провоцирует писать такой код. Не было бы её, не было бы такого кода.

M>Расскажи, как твой вариант помог бы. У тебя же буквы будут рандомно раскиданы повсюду.

Помог бы тем, что наивный код вида 'А' <= ch && ch <= 'Я' не сработал бы сразу и разработчику сразу пришлось бы думать о правильном подходе.

Re[7]: А зачем русским буквам отдельные символы?

От:	Mamut	http://dmitriid.com
Дата:	12.04.20 13:40
Оценка:

M>>Расскажи, как твой вариант помог бы. У тебя же буквы будут рандомно раскиданы повсюду.

vsb>Помог бы тем, что наивный код вида 'А' <= ch && ch <= 'Я' не сработал бы сразу и разработчику сразу пришлось бы думать о правильном подходе.

Ну и расскажи мне, каким будет правильный подход в условиях, когда буквы рандомно раскиданы по всему алфавиту?

dmitriid.com … GitHub … LinkedIn

Re[8]: А зачем русским буквам отдельные символы?

	От:	vsb
	Дата:	12.04.20 14:19
	Оценка:

Здравствуйте, Mamut, Вы писали:

M>>>Расскажи, как твой вариант помог бы. У тебя же буквы будут рандомно раскиданы повсюду.

vsb>>Помог бы тем, что наивный код вида 'А' <= ch && ch <= 'Я' не сработал бы сразу и разработчику сразу пришлось бы думать о правильном подходе.

M>Ну и расскажи мне, каким будет правильный подход в условиях, когда буквы рандомно раскиданы по всему алфавиту?

"АБВГДЕЁЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯабвгдеёжзийклмнопрстуфхцчшщъыьэюя".indexOf(ch) != -1

Re[9]: А зачем русским буквам отдельные символы?

От:	Mamut	http://dmitriid.com
Дата:	12.04.20 14:40
Оценка:

vsb>>>Помог бы тем, что наивный код вида 'А' <= ch && ch <= 'Я' не сработал бы сразу и разработчику сразу пришлось бы думать о правильном подходе.

M>>Ну и расскажи мне, каким будет правильный подход в условиях, когда буквы рандомно раскиданы по всему алфавиту?

vsb>

"АБВГДЕЁЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯабвгдеёжзийклмнопрстуфхцчшщъыьэюя".indexOf(ch) != -1

То есть ты предлагаешь вручную вбивать весь алфавит? Ладно, простейший случай ты криво, но решил. Что будем делать с сортировкой?

dmitriid.com … GitHub … LinkedIn

Re[10]: А зачем русским буквам отдельные символы?

	От:	vsb
	Дата:	12.04.20 19:41
	Оценка:

Здравствуйте, Mamut, Вы писали:

vsb>>>>Помог бы тем, что наивный код вида 'А' <= ch && ch <= 'Я' не сработал бы сразу и разработчику сразу пришлось бы думать о правильном подходе.

M>>>Ну и расскажи мне, каким будет правильный подход в условиях, когда буквы рандомно раскиданы по всему алфавиту?

vsb>>

"АБВГДЕЁЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯабвгдеёжзийклмнопрстуфхцчшщъыьэюя".indexOf(ch) != -1

M>То есть ты предлагаешь вручную вбивать весь алфавит?

Ну вообще я рассчитывал, что в Java это есть из коробки, но не нашёл. Возможно надо подключить библиотеку ICU, лень смотреть, никогда с ней не работал.

> Ладно, простейший случай ты криво, но решил.

Почему криво?

> Что будем делать с сортировкой?

А тут всё отлично:

        Locale locale = Locale.forLanguageTag("ru");
        Collator collator = Collator.getInstance(locale);
        System.out.println(locale);
        System.out.println(collator.compare("А", "Ё"));
        System.out.println(collator.compare("Ё", "Я"));

А что ты делаешь сейчас без специального API? Делаешь вид, что буквы "ё" не существует?

Re[4]: А зачем русским буквам отдельные символы?

	От:	Cyberax
	Дата:	12.04.20 22:32
	Оценка:	+3

Здравствуйте, Mamut, Вы писали:

M>И? То, что они не отличаются в компьютерных шрифтах, говорит только о том, что компьютеры в целом убили понятие типографики. И, вдобавок, у тебя внезапно на ровном месте появляется дополнительные сложности для обработки таких текстов:
Логичный Юникод можно было бы делать двумя фундаментально разными способами:
1. Объединить графически одинаковые символы в одном коде. Затем для преобразования строчных в прописные буквы использовать языково-специфичные таблицы (которые всё равно нужны).
2. Разделить каждый национальный алфавит в свой диапазон. Т.е. чтобы польская A отличалась от латинской A, а китайский "喝" отличался от японского "喝" (который я даже сюда скопировать не могу, оно заменяется на китайский).

Но в итоге получилась смесь всего со всем, в которой нереально разобраться без пары кубов очень крепкого наркотика.

Sapienti sat!

|< < 1 2 3 4 5 6 > >|

Переместить
Удалить
Выделить ветку

Пока на собственное сообщение не было ответов, его можно удалить.

Заголовок: