Re: А зачем русским буквам отдельные символы?
От: Ops Россия  
Дата: 10.04.20 06:39
Оценка: +7 :))) :))
Здравствуйте, vsb, Вы писали:

vsb>Тут в очередной раз наслаждаюсь отловом бага, когда в коде написано Tехосмотр (первая буква латинская). И возник вопрос, а зачем вообще этим буквам назначили отдельные коды? Во всех шрифтах, которые я видел, латинская T и русская Т полностью идентичны. Не разумней было бы назначить отдельные символы только тем буквам, которые отличаются от латинских? Тут даже цель не в экономии битов, а именно в исключении ситуации, когда выглядит одинаково, а коды разные.


Куда хуже "С", она, сука, еще и на одной кнопке.
Переубедить Вас, к сожалению, мне не удастся, поэтому сразу перейду к оскорблениям.
Re: А зачем русским буквам отдельные символы?
От: Stanislav V. Zudin Россия  
Дата: 09.04.20 15:02
Оценка: 1 (1) +8 -1
Здравствуйте, vsb, Вы писали:

vsb>Тут в очередной раз наслаждаюсь отловом бага, когда в коде написано Tехосмотр (первая буква латинская). И возник вопрос, а зачем вообще этим буквам назначили отдельные коды? Во всех шрифтах, которые я видел, латинская T и русская Т полностью идентичны. Не разумней было бы назначить отдельные символы только тем буквам, которые отличаются от латинских? Тут даже цель не в экономии битов, а именно в исключении ситуации, когда выглядит одинаково, а коды разные.


vsb>К примеру в казахском языке используются русские буквы плюс 9 своих, никто эти русские буквы в таблице символов не дублирует. Вроде бы то же самое относится к европейским языкам, там тоже используются латинские буквы + несколько своих.


А сортировать как будешь?
_____________________
С уважением,
Stanislav V. Zudin
Re: А зачем русским буквам отдельные символы?
От: Pavel Dvorkin Россия  
Дата: 09.04.20 15:07
Оценка: 5 (4) +5
Здравствуйте, vsb, Вы писали:

vsb>Тут в очередной раз наслаждаюсь отловом бага, когда в коде написано Tехосмотр (первая буква латинская). И возник вопрос, а зачем вообще этим буквам назначили отдельные коды? Во всех шрифтах, которые я видел, латинская T и русская Т полностью идентичны. Не разумней было бы назначить отдельные символы только тем буквам, которые отличаются от латинских? Тут даже цель не в экономии битов, а именно в исключении ситуации, когда выглядит одинаково, а коды разные.


Было. ДКОИ-8, кодировка ЕС ЭВМ. См. там "Совмещение букв".

https://ru.wikipedia.org/wiki/%D0%94%D0%9A%D0%9E%D0%98
With best regards
Pavel Dvorkin
Re: А зачем русским буквам отдельные символы?
От: Mamut Швеция http://dmitriid.com
Дата: 09.04.20 23:45
Оценка: +7
vsb>Тут в очередной раз наслаждаюсь отловом бага, когда в коде написано Tехосмотр (первая буква латинская). И возник вопрос, а зачем вообще этим буквам назначили отдельные коды? Во всех шрифтах, которые я видел, латинская T и русская Т полностью идентичны.

Потому что шрифт и смысл тех символов, которые шрифт отображает, — это две большие разницы. И ожидается, что программы будут работать со смыслом символов, а не с их начертаниями. Идиотизм с кодировками мир уже прошел в 80е-90е-начало-2000х и возвращаться к нему не хочет по вполне понятным причинам.

Ты предлагаешь не просто плохую кодировку, а худшую из возможных, которая даже близко не позволяет иметь в тексте различимые кодом слова более, чем на одном языке. Как человек, которому приходилось в начале-середине 2000-х выводить на экран и в документы тексты, содержащие русский, английский и турецкий, ответственно заявляю: Юникод — лучшее, что произошло в развитии компьютеров.


dmitriid.comGitHubLinkedIn
Re: А зачем русским буквам отдельные символы?
От: Marty Пират https://www.youtube.com/channel/UChp5PpQ6T4-93HbNF-8vSYg
Дата: 10.04.20 03:48
Оценка: 1 (1) +2 :)))
Здравствуйте, vsb, Вы писали:

vsb>К примеру в казахском языке используются русские буквы плюс 9 своих, никто эти русские буквы в таблице символов не дублирует. Вроде бы то же самое относится к европейским языкам, там тоже используются латинские буквы + несколько своих.


Бридлагав байди ищи дальши. Г бримирв, абьидинидь 'В' и 'У' — так, в латинском эти символы (V/U) долгое время обозначали одно и то же. 'О' и 'А' — всё равно практически всегда 'А' говорим. Аналогично 'Е' и 'И'. 'Б' и 'П', 'Д' и 'Т', 'З' и 'С', 'Г' и 'К' — зачем нам это ненужное разделение на звонкие/глухие? Да, твердый знак тоже не нужен, 'Ю' — тоже

В общем, пытливый ум может предложить еще много реформ
Маньяк Робокряк колесит по городу
Re: А зачем русским буквам отдельные символы?
От: kov_serg Россия  
Дата: 09.04.20 15:05
Оценка: +6
Здравствуйте, vsb, Вы писали:

vsb>Тут в очередной раз наслаждаюсь отловом бага, когда в коде написано Tехосмотр (первая буква латинская). И возник вопрос, а зачем вообще этим буквам назначили отдельные коды? Во всех шрифтах, которые я видел, латинская T и русская Т полностью идентичны. Не разумней было бы назначить отдельные символы только тем буквам, которые отличаются от латинских? Тут даже цель не в экономии битов, а именно в исключении ситуации, когда выглядит одинаково, а коды разные.

Регулярки в помощь. А вообще нормальные среды умеют подсвечивать не латиницу.

vsb>К примеру в казахском языке используются русские буквы плюс 9 своих, никто эти русские буквы в таблице символов не дублирует. Вроде бы то же самое относится к европейским языкам, там тоже используются латинские буквы + несколько своих.

Поизучайте unicode вообще волосы на подмышках зашевеляться.
Re[2]: А зачем русским буквам отдельные символы?
От: Pavel Dvorkin Россия  
Дата: 09.04.20 15:19
Оценка: +1 :))) :))
Здравствуйте, Stanislav V. Zudin, Вы писали:

SVZ>А сортировать как будешь?


Сортировать — это полбеды, если знать, что именно тут. А вот как узнать ?

Иду я как-то по городу в 90-е годы (а тогда вывесок на английском было полно, потом стало поменьше) и вижу надпись на здании MEXA

Хм. MEXA . На каком это языке ? Английском ? Нехарактерное какое-то окончание "A". На каком тогда ? И что это такое ?

Через секунду доходит. Никакое это не таинственное MEXA, а просто МЕХА.
With best regards
Pavel Dvorkin
Re: А зачем русским буквам отдельные символы?
От: pagid Россия  
Дата: 10.04.20 06:25
Оценка: +5
Здравствуйте, vsb, Вы писали:

vsb>Тут в очередной раз наслаждаюсь отловом бага, когда в коде написано Tехосмотр (первая буква латинская). И возник вопрос, а зачем вообще этим буквам назначили отдельные коды? Во всех шрифтах, которые я видел, латинская T и русская Т полностью идентичны. Не разумней было бы назначить отдельные символы только тем буквам, которые отличаются от латинских? Тут даже цель не в экономии битов, а именно в исключении ситуации, когда выглядит одинаково, а коды разные.

То есть прописные "Т" должны совпадать, а строчные "т" и "t" быть разными. Это просто праздник какой-то получится.
Re[3]: А зачем русским буквам отдельные символы?
От: Stanislav V. Zudin Россия  
Дата: 09.04.20 15:28
Оценка: :))) :)
Здравствуйте, Pavel Dvorkin, Вы писали:

PD>Сортировать — это полбеды, если знать, что именно тут. А вот как узнать ?

Да, без контекста не узнаешь.

PD>Иду я как-то по городу в 90-е годы (а тогда вывесок на английском было полно, потом стало поменьше) и вижу надпись на здании MEXA

PD>Хм. MEXA . На каком это языке ? Английском ? Нехарактерное какое-то окончание "A". На каком тогда ? И что это такое ?
PD>Через секунду доходит. Никакое это не таинственное MEXA, а просто МЕХА.

Несколько лет назад по соцсетям ходила байка:

Еду, вижу — на фасаде здания вывеска: "ДОМ ГОТОВ". Ломаю голову, это что же получается, только готы будут жить? Потом доходит, что дом готОв...

_____________________
С уважением,
Stanislav V. Zudin
Re[4]: А зачем русским буквам отдельные символы?
От: Буравчик Россия  
Дата: 09.04.20 15:42
Оценка: :))) :)
Здравствуйте, Stanislav V. Zudin, Вы писали:

SVZ>

SVZ>Еду, вижу — на фасаде здания вывеска: "ДОМ ГОТОВ". Ломаю голову, это что же получается, только готы будут жить? Потом доходит, что дом готОв...


Из той же серии: "юбка с запахом"
Best regards, Буравчик
Re[4]: А зачем русским буквам отдельные символы?
От: vsb Казахстан  
Дата: 10.04.20 00:02
Оценка: :))) :)
Здравствуйте, Mamut, Вы писали:

vsb>>>К примеру в казахском языке используются русские буквы плюс 9 своих, никто эти русские буквы в таблице символов не дублирует. Вроде бы то же самое относится к европейским языкам, там тоже используются латинские буквы + несколько своих.


vsb>>И это в твоём любимом юникоде.


M>И? Что тебе не нравится? Ты 10 апреля 2020-го года впервые узнал, что есть алфавиты на основе латиницы, алфавиты на основе кириллицы и вообще различные алфавиты?


Кириллица это алфавит на основе латинницы (а точнее оба алфавита произошли от греческого).
Отредактировано 10.04.2020 0:05 vsb . Предыдущая версия .
Re[2]: А зачем русским буквам отдельные символы?
От: vsb Казахстан  
Дата: 10.04.20 09:34
Оценка: :))) :)
Здравствуйте, pagid, Вы писали:

vsb>>Тут в очередной раз наслаждаюсь отловом бага, когда в коде написано Tехосмотр (первая буква латинская). И возник вопрос, а зачем вообще этим буквам назначили отдельные коды? Во всех шрифтах, которые я видел, латинская T и русская Т полностью идентичны. Не разумней было бы назначить отдельные символы только тем буквам, которые отличаются от латинских? Тут даже цель не в экономии битов, а именно в исключении ситуации, когда выглядит одинаково, а коды разные.

P>То есть прописные "Т" должны совпадать, а строчные "т" и "t" быть разными. Это просто праздник какой-то получится.

Да, такое бывает. Поэтому to upper/lower case нужно делать с правильной локалью.

PS моё предложение хорошо ещё тем, что научило бы русских программистов правильно работать с юникодом. А то расслабились совсем.
Re[2]: А зачем русским буквам отдельные символы?
От: vsb Казахстан  
Дата: 09.04.20 15:04
Оценка: 1 (1) +2
Здравствуйте, Stanislav V. Zudin, Вы писали:

vsb>>Тут в очередной раз наслаждаюсь отловом бага, когда в коде написано Tехосмотр (первая буква латинская). И возник вопрос, а зачем вообще этим буквам назначили отдельные коды? Во всех шрифтах, которые я видел, латинская T и русская Т полностью идентичны. Не разумней было бы назначить отдельные символы только тем буквам, которые отличаются от латинских? Тут даже цель не в экономии битов, а именно в исключении ситуации, когда выглядит одинаково, а коды разные.


vsb>>К примеру в казахском языке используются русские буквы плюс 9 своих, никто эти русские буквы в таблице символов не дублирует. Вроде бы то же самое относится к европейским языкам, там тоже используются латинские буквы + несколько своих.


SVZ>А сортировать как будешь?


По специальным таблицам, зависящим от локали, так же, как и сейчас это происходит. Но аргумент принят, спасибо, как минимум смысл в том, чтобы отличать английский Top (верх) от русского Тор-а (бог). Хотя опять же наверняка можно найти случаи, когда в каком-нибудь французском одно слово пишется идентично другому английскому, но имеет разное значение и ничего, живут и сортируют как-то.
Отредактировано 09.04.2020 15:06 vsb . Предыдущая версия . Еще …
Отредактировано 09.04.2020 15:05 vsb . Предыдущая версия .
Отредактировано 09.04.2020 15:04 vsb . Предыдущая версия .
А зачем русским буквам отдельные символы?
От: vsb Казахстан  
Дата: 09.04.20 14:58
Оценка: :)))
Тут в очередной раз наслаждаюсь отловом бага, когда в коде написано Tехосмотр (первая буква латинская). И возник вопрос, а зачем вообще этим буквам назначили отдельные коды? Во всех шрифтах, которые я видел, латинская T и русская Т полностью идентичны. Не разумней было бы назначить отдельные символы только тем буквам, которые отличаются от латинских? Тут даже цель не в экономии битов, а именно в исключении ситуации, когда выглядит одинаково, а коды разные.

К примеру в казахском языке используются русские буквы плюс 9 своих, никто эти русские буквы в таблице символов не дублирует. Вроде бы то же самое относится к европейским языкам, там тоже используются латинские буквы + несколько своих.
Re: А зачем русским буквам отдельные символы?
От: velkin Земля  
Дата: 09.04.20 15:14
Оценка: +3
Здравствуйте, vsb, Вы писали:

vsb>Не разумней было бы назначить отдельные символы только тем буквам, которые отличаются от латинских?


В чём здесь разумность? Полно языков отличающихся от латинского абсолютно всеми буквами. А ещё есть такое понятие как кодировка. Это предложение создать ещё одну кодировку, но вот такую странную, которой никто пользоваться не будет.

vsb>Тут даже цель не в экономии битов, а именно в исключении ситуации, когда выглядит одинаково, а коды разные.


У меня редактор kate показывает английский алфавит обычным шрифтом, а русский жирным, так что я сразу вижу какой символ какому алфавиту принадлежит. Нормальные люди создали бы программу, которая отлавливает ошибки использования в одном слове символов из различных алфавитов, а не стали бы пытаться внедрить другую кодировку.
Re[3]: А зачем русским буквам отдельные символы?
От: L.Long  
Дата: 09.04.20 18:54
Оценка: :)))
Здравствуйте, Pavel Dvorkin, Вы писали:

PD>Через секунду доходит. Никакое это не таинственное MEXA, а просто МЕХА.


Еще в начале 90-ых еду, вижу щит с нарисованной бабой и надписью "РОСНО". Полбашки сломал, пытаясь догадаться, что это за загадочное "почо".
Чем совершеннее технически средство, тем более примитивные, никчемные и бесполезные сведения при его помощи передаются.(с)Станислав Лем
Re[4]: А зачем русским буквам отдельные символы?
От: Ops Россия  
Дата: 10.04.20 06:30
Оценка: +2 :)
Здравствуйте, Pzz, Вы писали:

Pzz>Не только во французском. Например, бывает лук, из которого стрелают, а бывает лук, который едят. И это разные луки.


А сейчас еще у хипстеров лук бывает
Переубедить Вас, к сожалению, мне не удастся, поэтому сразу перейду к оскорблениям.
Re[4]: А зачем русским буквам отдельные символы?
От: Cyberax Марс  
Дата: 12.04.20 22:32
Оценка: +3
Здравствуйте, Mamut, Вы писали:

M>И? То, что они не отличаются в компьютерных шрифтах, говорит только о том, что компьютеры в целом убили понятие типографики. И, вдобавок, у тебя внезапно на ровном месте появляется дополнительные сложности для обработки таких текстов:

Логичный Юникод можно было бы делать двумя фундаментально разными способами:
1. Объединить графически одинаковые символы в одном коде. Затем для преобразования строчных в прописные буквы использовать языково-специфичные таблицы (которые всё равно нужны).
2. Разделить каждый национальный алфавит в свой диапазон. Т.е. чтобы польская A отличалась от латинской A, а китайский "喝" отличался от японского "喝" (который я даже сюда скопировать не могу, оно заменяется на китайский).

Но в итоге получилась смесь всего со всем, в которой нереально разобраться без пары кубов очень крепкого наркотика.
Sapienti sat!
Re[2]: А зачем русским буквам отдельные символы?
От: pagid Россия  
Дата: 13.04.20 07:28
Оценка: +3
Здравствуйте, Nuzhny, Вы писали:

N>Ещё есть украинский язык, в котором звук "ы" обозначается буквой "и", а звук "и" буквой "i". Это какой алфавит?

Это вариант кириллицы с буквой "i". Как оно там звучит к теме отношения не имеет.
Re[4]: А зачем русским буквам отдельные символы?
От: Блудов Павел Россия  
Дата: 14.04.20 19:50
Оценка: :)))
Здравствуйте, L.Long, Вы писали:

LL>Еще в начале 90-ых еду, вижу щит с нарисованной бабой и надписью "РОСНО".


Тебе повезло. У нашего офиса висел щит "Росно. The insurance company."
Re[10]: А зачем русским буквам отдельные символы?
От: Privalov  
Дата: 13.04.20 07:39
Оценка: 1 (1) +1
Здравствуйте, Mamut, Вы писали:

M>То есть ты предлагаешь вручную вбивать весь алфавит? Ладно, простейший случай ты криво, но решил. Что будем делать с сортировкой?


Ты будешь смеяться, для сортировки украинских фамилий в алфавитном порядке я вбивал руками украинский алфавит. Точнее, строил таблицу:
А Б В Г Д Е Є ... я
1 2 3 4 5 6 7 ... 70

Каждой букве ставил в соответствие число. Потому что иначе пришлось бы делать весьма нетривиальную обработку букв ЄєІіЇї, которые стоят в стороне. Кстати, с буквой Ё та же история.
Причем сортировка по такой таблице еще и не очень тормозила.
Веселее было другое. Я в то время встречал не меньше трех вариантов кодировки украинского языка. Попробуй импорт данных в таких условиях сделать.
Re: А зачем русским буквам отдельные символы?
От: fmiracle  
Дата: 09.04.20 15:36
Оценка: +2
Здравствуйте, vsb, Вы писали:

vsb>Во всех шрифтах, которые я видел, латинская T и русская Т полностью идентичны.


Ну тогда посмотри шрифты, например, которые эмулируют прописные буквы...
Re[3]: А зачем русским буквам отдельные символы?
От: Mamut Швеция http://dmitriid.com
Дата: 09.04.20 23:53
Оценка: +1 -1
vsb>>К примеру в казахском языке используются русские буквы плюс 9 своих, никто эти русские буквы в таблице символов не дублирует. Вроде бы то же самое относится к европейским языкам, там тоже используются латинские буквы + несколько своих.

vsb>И это в твоём любимом юникоде.


И? Что тебе не нравится? Ты 10 апреля 2020-го года впервые узнал, что есть алфавиты на основе латиницы, алфавиты на основе кириллицы и вообще различные алфавиты?


dmitriid.comGitHubLinkedIn
Отредактировано 09.04.2020 23:54 Mamut [ищите в других сетях] . Предыдущая версия .
Re[3]: А зачем русским буквам отдельные символы?
От: Ops Россия  
Дата: 10.04.20 06:35
Оценка: +2
Здравствуйте, vsb, Вы писали:

_>>А вообще нормальные среды умеют подсвечивать не латиницу.


vsb>Idea умеет?


IDEA так вообще правильный комплит показывает, если перепутал раскладку. Офигительная фича.
Переубедить Вас, к сожалению, мне не удастся, поэтому сразу перейду к оскорблениям.
Re[4]: А зачем русским буквам отдельные символы?
От: Mamut Швеция http://dmitriid.com
Дата: 11.04.20 21:10
Оценка: +1 :)
PD>>Через секунду доходит. Никакое это не таинственное MEXA, а просто МЕХА.
E>Смутно припоминаю какой-то популярный во время оно типа греческий бурдо-коньяк с похожим названием...

https://ru.wikipedia.org/wiki/Метакса


dmitriid.comGitHubLinkedIn
Re[4]: А зачем русским буквам отдельные символы?
От: vsb Казахстан  
Дата: 11.04.20 23:58
Оценка: :))
Здравствуйте, Mamut, Вы писали:

vsb>>Я имею в виду те буквы, которые не отличаются: AАBВEЕKКMМHНOОPРCСTТXХaаeеoоpрcсyуxх


M>И? То, что они не отличаются в компьютерных шрифтах, говорит только о том, что компьютеры в целом убили понятие типографики.


Ну и ладно.

M>И, вдобавок, у тебя внезапно на ровном месте появляется дополнительные сложности для обработки таких текстов:


M>- B это заглавная от б или b?

M>- T это заглавная от t или т?
M>- P — это «эр» или «пэ»?

Не представляю задач, когда мне это может понадобиться.

M>Это не говоря о диком усложнении программ на ровном месте.


Нет никакого усложнения. Всё остаётся ровно так же, как сейчас (если нормально поддерживать интернационализацию, а не только для русского и английского).

M>При том, что уже сейчас средний программист не может нормально обработать ситуации с «ё»: https://i.imgur.com/SMv1728.png


А в моём варианте сможет. Это "удобная" русская кодировка провоцирует писать такой код. Не было бы её, не было бы такого кода.

M>Это не говоря о том, что у тебя исключительно «западный» взгляд на вещи. Предлагаешь, например, так же объединить:


M>- Փ ARMENIAN CAPITAL LETTER PIWR

M>- օ ARMENIAN SMALL LETTER OH
M>- ০ BENGALI DIGIT ZERO
M>- ৪ BENGALI DIGIT FOUR
M>- 𑄽 CHAKMA DIGIT SEVEN
M>- ᱛ OL CHIKI LETTER AT
M>- ᳃ SUNDANESE PUNCTUATION BINDU CAKRA
M>- ᩅ TAI THAM LETTER WA
M>- ቀ ETHIOPIC SYLLABLE QA
M>- Ᏼ CHEROKEE LETTER YV
M>- Ꭲ CHEROKEE LETTER I
M>- Ꭼ CHEROKEE LETTER GV
M>- Ꭺ CHEROKEE LETTER GO

Думаю, каждый случай нужно рассматривать отдельно. В целом да, если два символа рисуются идентично, они должны использовать один код. Ещё, кстати, букву "ё" как букву с отдельным кодом тоже надо выкинуть. Правильная ё должна получаться через "е" + U+0308: "ё".
Re: А зачем русским буквам отдельные символы?
От: anonymouse2 Либерал Глобалист Безбожник Трансгуманист
Дата: 12.04.20 13:04
Оценка: :))
Здравствуйте, vsb, Вы писали:

vsb>К примеру в казахском языке используются русские буквы плюс 9 своих, никто эти русские буквы в таблице символов не дублирует. Вроде бы то же самое относится к европейским языкам, там тоже используются латинские буквы + несколько своих.


Подумал тут вот о чем.
А зачем заглавным буквам отдельные коды?
Ведь по большому счету, 'a' и 'A' это одна и та же буква.
А то что буква заглавная — это лишь вариант начертания, ничем не отличающийся от таких вариантов как bold, italic, underline, subscript, superscript и т.д. У italic шрифтов для некоторых букв начертание может отличаться даже сильнее, чем у заглавной от строчной.

По сути, заглавные буквы — это наследие ASCII, когда не было еще разделения между символами и кодовыми точками.
Заглавные буквы это особенность европейских языков. В китайских и других иероглифах заглавных букв нет.
Но в тех же европейских языках была "буквица" — когда первая буква главы писалась еще более крупным шрифтом и даже украшалась. Это явление того же порядка что и заглавные буквы как таковые, просто следующий уровень.
Нет такого преступления, на которое не пошло бы суверенное родоплеменное быдло ради продления своего бессмысленного рода и распространения своего бессмысленного генома.
Re[6]: А зачем русским буквам отдельные символы?
От: Ops Россия  
Дата: 16.04.20 09:47
Оценка: +1 :)
Здравствуйте, Erop, Вы писали:

M>>https://ru.wikipedia.org/wiki/Метакса


E>Точно -- ОН!!!


Вот буржуй. А мы слынчев бряг тогда глотали, та еще тормозуха.
Переубедить Вас, к сожалению, мне не удастся, поэтому сразу перейду к оскорблениям.
Re[8]: А зачем русским буквам отдельные символы?
От: Hobbes Россия  
Дата: 26.06.20 09:58
Оценка: +1 :)
Здравствуйте, Erop, Вы писали:

E>Всё так, но смысл брать в Греции метаксу, когда всюду есть узо?


Это которая анисовка?
Re[3]: А зачем русским буквам отдельные символы?
От: kov_serg Россия  
Дата: 09.04.20 15:49
Оценка: 2 (1)
Здравствуйте, vsb, Вы писали:

vsb>Idea умеет?


Settings > Inspections > Internationalization > Non-ASCII characters
Re[3]: А зачем русским буквам отдельные символы?
От: Stanislav V. Zudin Россия  
Дата: 09.04.20 15:08
Оценка: +1
Здравствуйте, vsb, Вы писали:

vsb>>>Тут в очередной раз наслаждаюсь отловом бага, когда в коде написано Tехосмотр (первая буква латинская). И возник вопрос, а зачем вообще этим буквам назначили отдельные коды? Во всех шрифтах, которые я видел, латинская T и русская Т полностью идентичны. Не разумней было бы назначить отдельные символы только тем буквам, которые отличаются от латинских? Тут даже цель не в экономии битов, а именно в исключении ситуации, когда выглядит одинаково, а коды разные.


SVZ>>А сортировать как будешь?


vsb>По специальным таблицам, зависящим от локали, так же, как и сейчас это происходит. Но аргумент принят, спасибо, как минимум смысл в том, чтобы отличать английский Top (верх) от русского Тор-а (бог).


Да, выделенное портит всю малину.

ЗЫ. Тор это не только бог но еще и пончик.
_____________________
С уважением,
Stanislav V. Zudin
Re[3]: А зачем русским буквам отдельные символы?
От: Pzz Россия https://github.com/alexpevzner
Дата: 09.04.20 18:16
Оценка: +1
Здравствуйте, vsb, Вы писали:

vsb>По специальным таблицам, зависящим от локали, так же, как и сейчас это происходит. Но аргумент принят, спасибо, как минимум смысл в том, чтобы отличать английский Top (верх) от русского Тор-а (бог). Хотя опять же наверняка можно найти случаи, когда в каком-нибудь французском одно слово пишется идентично другому английскому, но имеет разное значение и ничего, живут и сортируют как-то.


Не только во французском. Например, бывает лук, из которого стрелают, а бывает лук, который едят. И это разные луки.
Re[2]: А зачем русским буквам отдельные символы?
От: vsb Казахстан  
Дата: 10.04.20 09:33
Оценка: +1
Здравствуйте, Mihas, Вы писали:

M>Где-то я такое уже видел. Русские буквы насильно заменялись латинскими, если начертание совпадает.

M>Уж не с оформлением ли паспорта было связано...

Я такое встречал, когда интегрировался с казахстанской железной дорогой. Правда думал, что это они упоролись, а тут прочитал, что это какая-то старинная кодировка. Возможно какой-то старый советский софт стоял, который и в России где-нибудь стоит.
Re[5]: А зачем русским буквам отдельные символы?
От: Mamut Швеция http://dmitriid.com
Дата: 10.04.20 11:07
Оценка: +1
vsb>Кириллица это алфавит на основе латинницы

Что ты несешь

vsb>(а точнее оба алфавита произошли от греческого).


Из того, что оба алфавита произошли от греческого, никак не следует, что кириллица — алфавит на основе латиницы.


dmitriid.comGitHubLinkedIn
Re[3]: А зачем русским буквам отдельные символы?
От: Mamut Швеция http://dmitriid.com
Дата: 10.04.20 11:12
Оценка: -1
vsb>Да, такое бывает. Поэтому to upper/lower case нужно делать с правильной локалью.

Ты предлагаешь, чтобы в тексте, к каждой букве была прописана отдельная локаль?

vsb>PS моё предложение хорошо ещё тем, что научило бы русских программистов правильно работать с юникодом. А то расслабились совсем.


Что ты несешь.


dmitriid.comGitHubLinkedIn
Re[3]: А зачем русским буквам отдельные символы?
От: Kerk  
Дата: 10.04.20 21:16
Оценка: +1
Здравствуйте, Cyberax, Вы писали:

P>>То есть прописные "Т" должны совпадать, а строчные "т" и "t" быть разными. Это просто праздник какой-то получится.

C>В турецком именно так, строчная i в заглавной форме — İ.

Ну вот в турецком праздник и получился. То, что результат upper case i зависит от локали — это танец на граблях.
Re[3]: А зачем русским буквам отдельные символы?
От: Erop Россия  
Дата: 11.04.20 20:57
Оценка: +1
Здравствуйте, Pavel Dvorkin, Вы писали:

PD>Через секунду доходит. Никакое это не таинственное MEXA, а просто МЕХА.

Смутно припоминаю какой-то популярный во время оно типа греческий бурдо-коньяк с похожим названием...
Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском
Re[2]: А зачем русским буквам отдельные символы?
От: Erop Россия  
Дата: 12.04.20 00:05
Оценка: +1
Здравствуйте, Mihas, Вы писали:

M>Где-то я такое уже видел. Русские буквы насильно заменялись латинскими, если начертание совпадает.

M>Уж не с оформлением ли паспорта было связано...

Был под MS-DOS какой-то дебильный, но популярный редактор, который некоторые коды русских букв использовал, как служебный символы, для какой-то разметки, что ли. И там эти буквы были как раз такие, что у них были латинские "близнецы". И при локализации на русский, ничего умнее не придумали, чем автоматом заменять в русских текстах Н на H
Я помню, даже специальную программку накропал, что бы эти замены в русских словах находить и обратно тексты "расколдовывать"
Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском
Отредактировано 12.04.2020 12:17 Erop . Предыдущая версия .
Re[6]: А зачем русским буквам отдельные символы?
От: Mamut Швеция http://dmitriid.com
Дата: 12.04.20 09:10
Оценка: :)
M>>А какие решения ты предложишь? В турецком «и-с-точкой» (читается как «и») и «и-без-точки» (читается, как «ы») — две абсолютно разные буквы, со всем вытекающим.

E>Ну иметь ДВЕ турецкие буквы "турецкая и с точкой" и "турецкая и без точки", так же, как есть русская О, латинская O, и ещё 0 в придачу...

E>Или есть латинская l и 1

Да, это было бы решением.

E>Почему было и туркам не завести ДВЕ новые свои буквы и не страдать с перекодировками и сменами регистра?


Не турки это вводили


dmitriid.comGitHubLinkedIn
Re[6]: А зачем русским буквам отдельные символы?
От: vsb Казахстан  
Дата: 12.04.20 13:23
Оценка: :)
Здравствуйте, Mamut, Вы писали:

M>>>При том, что уже сейчас средний программист не может нормально обработать ситуации с «ё»: https://i.imgur.com/SMv1728.png


vsb>>А в моём варианте сможет. Это "удобная" русская кодировка провоцирует писать такой код. Не было бы её, не было бы такого кода.


M>Расскажи, как твой вариант помог бы. У тебя же буквы будут рандомно раскиданы повсюду.


Помог бы тем, что наивный код вида 'А' <= ch && ch <= 'Я' не сработал бы сразу и разработчику сразу пришлось бы думать о правильном подходе.
Re: А зачем русским буквам отдельные символы?
От: Nuzhny Россия https://github.com/Nuzhny007
Дата: 13.04.20 07:22
Оценка: +1
Здравствуйте, vsb, Вы писали:

vsb>К примеру в казахском языке используются русские буквы плюс 9 своих, никто эти русские буквы в таблице символов не дублирует. Вроде бы то же самое относится к европейским языкам, там тоже используются латинские буквы + несколько своих.


Ещё есть украинский язык, в котором звук "ы" обозначается буквой "и", а звук "и" буквой "i". Это какой алфавит?
Re[11]: А зачем русским буквам отдельные символы?
От: Dair Россия  
Дата: 13.04.20 08:02
Оценка: +1
Здравствуйте, Privalov, Вы писали:

P>Ты будешь смеяться, для сортировки украинских фамилий в алфавитном порядке я вбивал руками украинский алфавит. Точнее, строил таблицу:


С KOI8-R, кстати, иначе и нельзя было, она ж АБЦДЕФ расположена по кодам.

Хорошо что всё это в прошлом!
Re[12]: А зачем русским буквам отдельные символы?
От: Privalov  
Дата: 13.04.20 08:48
Оценка: +1
Здравствуйте, Dair, Вы писали:

D>С KOI8-R, кстати, иначе и нельзя было, она ж АБЦДЕФ расположена по кодам.


Сейчас, правда, можно обойтись чем-то типа indexof, тогда же это было дорого, поэтому я выкручивался таблицей. А может, просто не дотумкал.

D>Хорошо что всё это в прошлом!


Конечно, Зато, зная это прошлое, мы, в случае необходимости, не будем ждать милостей от ОС и окружения.
Re[5]: А зачем русским буквам отдельные символы?
От: Kerk  
Дата: 15.04.20 08:07
Оценка: +1
Здравствуйте, vsb, Вы писали:

M>>И, вдобавок, у тебя внезапно на ровном месте появляется дополнительные сложности для обработки таких текстов:


M>>- B это заглавная от б или b?

M>>- T это заглавная от t или т?
M>>- P — это «эр» или «пэ»?

vsb>Не представляю задач, когда мне это может понадобиться.


Ни разу не использовал функцию LowerCase()?
Re[8]: А зачем русским буквам отдельные символы?
От: Dair Россия  
Дата: 15.04.20 20:21
Оценка: +1
Здравствуйте, Erop, Вы писали:

E>Всё так, но смысл брать в Греции метаксу, когда всюду есть узо?


Тот же что и смысл брать в России коньяк, когда всюду есть водка.

Разные же напитки, хороши для разных поводов, под разное настроение.
Re[12]: А зачем русским буквам отдельные символы?
От: Privalov  
Дата: 17.04.20 09:59
Оценка: :)
Здравствуйте, Erop, Вы писали:

E>Во-о-от. Тебе она таки нравится. А меня буржуем за что-то обзывают... "С" == справедливость...


Я, что ли, тебя буржуем обозвал? Да, нормальная вещь. Но только если из Греции.
Re[3]: А зачем русским буквам отдельные символы?
От: Mystic Artifact  
Дата: 08.06.20 11:23
Оценка: +1
Здравствуйте, vsb, Вы писали:

vsb>Я имею в виду те буквы, которые не отличаются: AАBВEЕKКMМHНOОPРCСTТXХaаeеoоpрcсyуxх

Присмотритесь внимательно к начертаниям, например, русской К и латинской K, в разных шрифтах без засечек. Они отличаются и существенно. Неужто уже позабывали как "нормальные" русские глифы выглядят?
Re[3]: А зачем русским буквам отдельные символы?
От: Privalov  
Дата: 14.06.20 07:34
Оценка: +1
Здравствуйте, Erop, Вы писали:

E>Был под MS-DOS какой-то дебильный, но популярный редактор, который некоторые коды русских букв использовал, как служебный символы, для какой-то разметки, что ли.


Вспомнил! С быквами для разметки я не сталкивался. Были редакторы, которые просто не принимали некоторые коды кириллицы. Почему-то в память врезался код 224 (буква р). Возможно, были еще. Эти коды совпадали с рассшиеррыми кодами (стрелки, pgup/pgdn). Norton Editor этим страдал, помню. QEdit 2.07 тоже. В 2.08 его починили.
В FoxPro 2.0 с этим же столкнулись. Поправили только в 2.6. Тогда еще ходили рекомендации, где и что пропатчить в том же Norton Editor-е, чтобы решить проблему. Нужно было один байт в определенном месте обнулить. С ForPro такое не прокатывало, там таблицы динамически формировались.
P.S. Могу где-то напутать с названиями программ. И не могу утверждать на верняка, что были коды помимо 224. Но буква р доставила нам в свое время немало головняка.
Re[3]: А зачем русским буквам отдельные символы?
От: DenisCh Россия  
Дата: 15.06.20 01:39
Оценка: +1
Здравствуйте, Erop, Вы писали:

E>Был под MS-DOS какой-то дебильный, но популярный редактор, который некоторые коды русских букв использовал, как служебный символы, для какой-то разметки, что ли. И там эти буквы были как раз такие, что у них были латинские "близнецы". И при локализации на русский, ничего умнее не придумали, чем автоматом заменять в русских текстах Н на H


GoldEd же... Фидошный редактор... Но его давно уже вылечили...
... << RSDN@Home 1.0.0 alpha 5 rev. 0>>
Re[2]: А зачем русским буквам отдельные символы?
От: vsb Казахстан  
Дата: 09.04.20 15:07
Оценка:
Здравствуйте, kov_serg, Вы писали:

_>Регулярки в помощь.


Ну когда знаешь, что проблема в этом, то как бы и проблема уже на 90% решена. Вопрос в том, чтобы осознать, что какой-то нехороший человек сделал такую подставу.

_>А вообще нормальные среды умеют подсвечивать не латиницу.


Idea умеет?
Re[4]: А зачем русским буквам отдельные символы?
От: vsb Казахстан  
Дата: 09.04.20 20:20
Оценка:
Здравствуйте, kov_serg, Вы писали:

vsb>>Idea умеет?


_>Settings > Inspections > Internationalization > Non-ASCII characters


Так мне похожие надо, а не все. В данном случае не поможет, у меня эти символы в строке были, а не в идентификаторе (и вообще не в проекте, а в отдельном файле, на него инспекции идея не показывает).
Re[2]: А зачем русским буквам отдельные символы?
От: vsb Казахстан  
Дата: 09.04.20 23:49
Оценка:
Здравствуйте, Mamut, Вы писали:

vsb>>Тут в очередной раз наслаждаюсь отловом бага, когда в коде написано Tехосмотр (первая буква латинская). И возник вопрос, а зачем вообще этим буквам назначили отдельные коды? Во всех шрифтах, которые я видел, латинская T и русская Т полностью идентичны.


M>Потому что шрифт и смысл тех символов, которые шрифт отображает, — это две большие разницы. И ожидается, что программы будут работать со смыслом символов, а не с их начертаниями. Идиотизм с кодировками мир уже прошел в 80е-90е-начало-2000х и возвращаться к нему не хочет по вполне понятным причинам.


M>Ты предлагаешь не просто плохую кодировку, а худшую из возможных, которая даже близко не позволяет иметь в тексте различимые кодом слова более, чем на одном языке. Как человек, которому приходилось в начале-середине 2000-х выводить на экран и в документы тексты, содержащие русский, английский и турецкий, ответственно заявляю: Юникод — лучшее, что произошло в развитии компьютеров.


vsb>К примеру в казахском языке используются русские буквы плюс 9 своих, никто эти русские буквы в таблице символов не дублирует. Вроде бы то же самое относится к европейским языкам, там тоже используются латинские буквы + несколько своих.


И это в твоём любимом юникоде.
Re[2]: А зачем русским буквам отдельные символы?
От: Cyberax Марс  
Дата: 10.04.20 01:53
Оценка:
Здравствуйте, Stanislav V. Zudin, Вы писали:

vsb>>К примеру в казахском языке используются русские буквы плюс 9 своих, никто эти русские буквы в таблице символов не дублирует. Вроде бы то же самое относится к европейским языкам, там тоже используются латинские буквы + несколько своих.

SVZ>А сортировать как будешь?
Так же как сортируют эстонский (Z после S) или турецкий (i и i-без-точки) — с учётом локали.
Sapienti sat!
Re[5]: А зачем русским буквам отдельные символы?
От: Artem Korneev США https://www.linkedin.com/in/artemkorneev/
Дата: 10.04.20 03:58
Оценка:
Здравствуйте, vsb, Вы писали:

vsb>Кириллица это алфавит на основе латинницы (а точнее оба алфавита произошли от греческого).


Это два взаимоисключающих утверждения.
С уважением, Artem Korneev.
Re[3]: А зачем русским буквам отдельные символы?
От: sambl74 Россия  
Дата: 10.04.20 04:51
Оценка:
Здравствуйте, vsb, Вы писали:

vsb>смысл в том, чтобы отличать английский Top (верх) от русского Тор-а (бог)


Давно бублик богом стал :-D?
Re[4]: А зачем русским буквам отдельные символы?
От: Marty Пират https://www.youtube.com/channel/UChp5PpQ6T4-93HbNF-8vSYg
Дата: 10.04.20 05:00
Оценка:
Здравствуйте, sambl74, Вы писали:

vsb>>смысл в том, чтобы отличать английский Top (верх) от русского Тор-а (бог)


S>Давно бублик богом стал :-D?


А английский верх?
Маньяк Робокряк колесит по городу
Re[3]: А зачем русским буквам отдельные символы?
От: Stanislav V. Zudin Россия  
Дата: 10.04.20 05:20
Оценка:
Здравствуйте, Cyberax, Вы писали:

SVZ>>А сортировать как будешь?

C>Так же как сортируют эстонский (Z после S) или турецкий (i и i-без-точки) — с учётом локали.

Ну вот и получится, что русские слова будут перемешаны с английскими.
Это все правила поменяются.

Довелось как-то с ICU поработать. Даже с одной единственной "Ё" было столько канители, что ну его в баню
_____________________
С уважением,
Stanislav V. Zudin
Re[2]: А зачем русским буквам отдельные символы?
От: pagid Россия  
Дата: 10.04.20 06:21
Оценка:
Здравствуйте, fmiracle, Вы писали:

F>Ну тогда посмотри шрифты, например, которые эмулируют прописные буквы...

Наверно хотел написать рукописные?
А у Т проблема проявляется уже в строчных — "т" и "t"
Re[4]: А зачем русским буквам отдельные символы?
От: pagid Россия  
Дата: 10.04.20 06:32
Оценка:
Здравствуйте, Pzz, Вы писали:

Pzz>Не только во французском. Например, бывает лук, из которого стрелают, а бывает лук, который едят. И это разные луки.

Но проблем для сортировки при этом нет.
Re[5]: А зачем русским буквам отдельные символы?
От: pagid Россия  
Дата: 10.04.20 06:39
Оценка:
Здравствуйте, vsb, Вы писали:

vsb>Кириллица это алфавит на основе латинницы (а точнее оба алфавита произошли от греческого).


Так то на основе (греческого). А вот большинство европейских это есть латиница, но некоторые с дополнительными буквами, и казахский это и есть кириллица, но есть буквы, которых нет в русском алфавите.
Re[5]: А зачем русским буквам отдельные символы?
От: sambl74 Россия  
Дата: 10.04.20 06:52
Оценка:
Здравствуйте, Marty, Вы писали:

M>А английский верх?


Ну вообще видимо давно, если даже гугл транслейт про это знает:
Re[6]: А зачем русским буквам отдельные символы?
От: Marty Пират https://www.youtube.com/channel/UChp5PpQ6T4-93HbNF-8vSYg
Дата: 10.04.20 07:22
Оценка:
Здравствуйте, sambl74, Вы писали:

M>>А английский верх?


S>Ну вообще видимо давно, если даже гугл транслейт про это знает:

S>Image: top.png

И где тут про стал богом?
Маньяк Робокряк колесит по городу
Re[2]: А зачем русским буквам отдельные символы?
От: Marty Пират https://www.youtube.com/channel/UChp5PpQ6T4-93HbNF-8vSYg
Дата: 10.04.20 07:23
Оценка:
Здравствуйте, Ops, Вы писали:


Ops>Куда хуже "С", она, сука, еще и на одной кнопке.


Это да, повбывав бы
Маньяк Робокряк колесит по городу
Re: А зачем русским буквам отдельные символы?
От: Mihas  
Дата: 10.04.20 08:29
Оценка:
Здравствуйте, vsb, Вы писали:

Где-то я такое уже видел. Русские буквы насильно заменялись латинскими, если начертание совпадает.
Уж не с оформлением ли паспорта было связано...
Re[4]: А зачем русским буквам отдельные символы?
От: Mr.Delphist  
Дата: 10.04.20 09:26
Оценка:
Здравствуйте, sambl74, Вы писали:

S>Здравствуйте, vsb, Вы писали:


vsb>>смысл в том, чтобы отличать английский Top (верх) от русского Тор-а (бог)


S>Давно бублик богом стал :-D?


Скандинавы смотрят на sambl74 с удивлением.
Re[4]: А зачем русским буквам отдельные символы?
От: Mamut Швеция http://dmitriid.com
Дата: 10.04.20 11:14
Оценка:
SVZ>Довелось как-то с ICU поработать. Даже с одной единственной "Ё" было столько канители, что ну его в баню

Потому что ё стоит не в ряде а-я, а за его пределами ICU, наверное, чуть ли не единственная библиотека, которая умеет в сортировки всего и вся, учитывая все особенности.


dmitriid.comGitHubLinkedIn
Re[5]: А зачем русским буквам отдельные символы?
От: Stanislav V. Zudin Россия  
Дата: 10.04.20 11:26
Оценка:
Здравствуйте, Mamut, Вы писали:


SVZ>>Довелось как-то с ICU поработать. Даже с одной единственной "Ё" было столько канители, что ну его в баню


M>Потому что ё стоит не в ряде а-я, а за его пределами ICU, наверное, чуть ли не единственная библиотека, которая умеет в сортировки всего и вся, учитывая все особенности.


Не так уж и хорошо умеет, как оказалось.
Почти год назад сортировка у многих языков не соответствовала стандарту. Может чего поправили, но я не проверял.
_____________________
С уважением,
Stanislav V. Zudin
Re[6]: А зачем русским буквам отдельные символы?
От: Mamut Швеция http://dmitriid.com
Дата: 10.04.20 11:28
Оценка:
SVZ>Не так уж и хорошо умеет, как оказалось.
SVZ>Почти год назад сортировка у многих языков не соответствовала стандарту. Может чего поправили, но я не проверял.

Они емнип отстают по реализации, это да.


dmitriid.comGitHubLinkedIn
Re[7]: А зачем русским буквам отдельные символы?
От: sambl74 Россия  
Дата: 10.04.20 12:15
Оценка:
Здравствуйте, Marty, Вы писали:

M>Здравствуйте, sambl74, Вы писали:


M>>>А английский верх?


S>>Ну вообще видимо давно, если даже гугл транслейт про это знает:

S>>Image: top.png

M>И где тут про стал богом?


Это ответ на твой "А английский верх".
Re[5]: А зачем русским буквам отдельные символы?
От: sambl74 Россия  
Дата: 10.04.20 12:15
Оценка:
Здравствуйте, Mr.Delphist, Вы писали:

MD>Скандинавы смотрят на sambl74 с удивлением.


Да, один из их богов — бублик. Удивительно
Re[2]: А зачем русским буквам отдельные символы?
От: Cyberax Марс  
Дата: 10.04.20 18:35
Оценка:
Здравствуйте, pagid, Вы писали:

P>То есть прописные "Т" должны совпадать, а строчные "т" и "t" быть разными. Это просто праздник какой-то получится.

В турецком именно так, строчная i в заглавной форме — İ.
Sapienti sat!
Re[4]: А зачем русским буквам отдельные символы?
От: Mamut Швеция http://dmitriid.com
Дата: 10.04.20 22:49
Оценка:
P>>>То есть прописные "Т" должны совпадать, а строчные "т" и "t" быть разными. Это просто праздник какой-то получится.
C>>В турецком именно так, строчная i в заглавной форме — İ.

K>Ну вот в турецком праздник и получился. То, что результат upper case i зависит от локали — это танец на граблях.


А какие решения ты предложишь? В турецком «и-с-точкой» (читается как «и») и «и-без-точки» (читается, как «ы») — две абсолютно разные буквы, со всем вытекающим.

И таких букв почти в каждом языке — до черта. Собственно, «и-с-точкой», немецкая эсцет и несколько других букв используются в качестве проверки, правильно языки и библиотеки работают со строками. Справляются далеко не все


dmitriid.comGitHubLinkedIn
Re[5]: А зачем русским буквам отдельные символы?
От: Kerk  
Дата: 11.04.20 00:03
Оценка:
Здравствуйте, Mamut, Вы писали:

P>>>>То есть прописные "Т" должны совпадать, а строчные "т" и "t" быть разными. Это просто праздник какой-то получится.

C>>>В турецком именно так, строчная i в заглавной форме — İ.

K>>Ну вот в турецком праздник и получился. То, что результат upper case i зависит от локали — это танец на граблях.


M>А какие решения ты предложишь? В турецком «и-с-точкой» (читается как «и») и «и-без-точки» (читается, как «ы») — две абсолютно разные буквы, со всем вытекающим.


Так очень просто. Дать туркам свои собственные i и I, не мешая всё их в кучу с латиницей. Тут же вся тема об этом. В кириллице тоже некоторые буквы в некоторых регистрах с латиницей совпадают. И вполне можно было бы такую же путаницу организовать. Но не стали почему-то.
Re[6]: А зачем русским буквам отдельные символы?
От: Cyberax Марс  
Дата: 11.04.20 01:16
Оценка:
Здравствуйте, Kerk, Вы писали:

K>Так очень просто. Дать туркам свои собственные i и I, не мешая всё их в кучу с латиницей. Тут же вся тема об этом. В кириллице тоже некоторые буквы в некоторых регистрах с латиницей совпадают. И вполне можно было бы такую же путаницу организовать. Но не стали почему-то.

Скорее по историческим причинам — русский алфавит всё-таки сильно отличается в целом от английского или греческого. В теории, сейчас это могло бы решиться альтернативными вариантами символов, но первый Юникод проектировался до них.

С китайским, кстати, таки альтернативные написания пришлось использовать. Например, символ (喝 — "пить") рисуется немного по-разному в японской и китайской локали, хотя имеет тот же код. См.: https://en.wiktionary.org/wiki/%E5%96%9D#Kanji и https://en.wiktionary.org/wiki/%E5%96%9D#Han_character
Sapienti sat!
Re[6]: А зачем русским буквам отдельные символы?
От: Mamut Швеция http://dmitriid.com
Дата: 11.04.20 07:58
Оценка:
K>Так очень просто. Дать туркам свои собственные i и I, не мешая всё их в кучу с латиницей.

Это да, было бы решением

K>Тут же вся тема об этом. В кириллице тоже некоторые буквы в некоторых регистрах с латиницей совпадают. И вполне можно было бы такую же путаницу организовать. Но не стали почему-то.


Хе-хе. Мы тут чутка спорим про латиницу-кириллицу, а в Юникоде есть CJK Там вообще политические баталии и обиды на уровне целых стран.


dmitriid.comGitHubLinkedIn
Re[3]: А зачем русским буквам отдельные символы?
От: Dair Россия  
Дата: 11.04.20 09:27
Оценка:
Здравствуйте, vsb, Вы писали:

vsb>Я такое встречал, когда интегрировался с казахстанской железной дорогой. Правда думал, что это они упоролись, а тут прочитал, что это какая-то старинная кодировка. Возможно какой-то старый советский софт стоял, который и в России где-нибудь стоит.


В какой-то начальный момент российская система госзакупок была написана обычными парнями, которые про плохое не думали.

Ушлые чиновники догадались устраивать конкурсы на "Aвтомoбиль" (выделил латинские буквы), ну чтобы только свои побеждали.

В результате вроде сделали патч, который это фиксит.
Re: А зачем русским буквам отдельные символы?
От: Erop Россия  
Дата: 11.04.20 20:57
Оценка:
Здравствуйте, vsb, Вы писали:

vsb>Тут в очередной раз наслаждаюсь отловом бага, когда в коде написано Tехосмотр (первая буква латинская). И возник вопрос, а зачем вообще этим буквам назначили отдельные коды? Во всех шрифтах, которые я видел, латинская T и русская Т полностью идентичны. Не разумней было бы назначить отдельные символы только тем буквам, которые отличаются от латинских? Тут даже цель не в экономии битов, а именно в исключении ситуации, когда выглядит одинаково, а коды разные.


Ну, например, во всех шрифтах, которые я видел маленькие версии букв Tt Тт и Tt Тm отличаются. Последняя, кстати, похожа на m, а не на t...
Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском
Re[5]: А зачем русским буквам отдельные символы?
От: Erop Россия  
Дата: 11.04.20 21:26
Оценка:
Здравствуйте, Mamut, Вы писали:

PD>>>Через секунду доходит. Никакое это не таинственное MEXA, а просто МЕХА.

E>>Смутно припоминаю какой-то популярный во время оно типа греческий бурдо-коньяк с похожим названием...

M>https://ru.wikipedia.org/wiki/Метакса


Точно -- ОН!!!
Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском
Re[2]: А зачем русским буквам отдельные символы?
От: vsb Казахстан  
Дата: 11.04.20 22:45
Оценка:
Здравствуйте, Erop, Вы писали:

vsb>>Тут в очередной раз наслаждаюсь отловом бага, когда в коде написано Tехосмотр (первая буква латинская). И возник вопрос, а зачем вообще этим буквам назначили отдельные коды? Во всех шрифтах, которые я видел, латинская T и русская Т полностью идентичны. Не разумней было бы назначить отдельные символы только тем буквам, которые отличаются от латинских? Тут даже цель не в экономии битов, а именно в исключении ситуации, когда выглядит одинаково, а коды разные.


E>Ну, например, во всех шрифтах, которые я видел маленькие версии букв Tt Тт и Tt Тm отличаются. Последняя, кстати, похожа на m, а не на t...


Я имею в виду те буквы, которые не отличаются: AАBВEЕKКMМHНOОPРCСTТXХaаeеoоpрcсyуxх
Отредактировано 11.04.2020 22:46 vsb . Предыдущая версия .
Re[3]: А зачем русским буквам отдельные символы?
От: Mamut Швеция http://dmitriid.com
Дата: 11.04.20 23:30
Оценка:
vsb>Я имею в виду те буквы, которые не отличаются: AАBВEЕKКMМHНOОPРCСTТXХaаeеoоpрcсyуxх

И? То, что они не отличаются в компьютерных шрифтах, говорит только о том, что компьютеры в целом убили понятие типографики. И, вдобавок, у тебя внезапно на ровном месте появляется дополнительные сложности для обработки таких текстов:

— B это заглавная от б или b?
— T это заглавная от t или т?
— P — это «эр» или «пэ»?

Это не говоря о диком усложнении программ на ровном месте. При том, что уже сейчас средний программист не может нормально обработать ситуации с «ё»: https://i.imgur.com/SMv1728.png

Это не говоря о том, что у тебя исключительно «западный» взгляд на вещи. Предлагаешь, например, так же объединить:

— Փ ARMENIAN CAPITAL LETTER PIWR
— օ ARMENIAN SMALL LETTER OH
— ০ BENGALI DIGIT ZERO
— ৪ BENGALI DIGIT FOUR
— 𑄽 CHAKMA DIGIT SEVEN
— ᱛ OL CHIKI LETTER AT
— ᳃ SUNDANESE PUNCTUATION BINDU CAKRA
— ᩅ TAI THAM LETTER WA
— ቀ ETHIOPIC SYLLABLE QA
— Ᏼ CHEROKEE LETTER YV
— Ꭲ CHEROKEE LETTER I
— Ꭼ CHEROKEE LETTER GV
— Ꭺ CHEROKEE LETTER GO

и т.п.? Ну, на а чо. Пишутся одинаково (или почти одинаково), еще и наверняка из одного алфавита произошли или основаны друг на друге, да.


dmitriid.comGitHubLinkedIn
Re[3]: А зачем русским буквам отдельные символы?
От: Erop Россия  
Дата: 11.04.20 23:51
Оценка:
Здравствуйте, vsb, Вы писали:

vsb>Я имею в виду те буквы, которые не отличаются: AАBВEЕKКMМHНOОPРCСTТXХaаeеoоpрcсyуxх


То есть ещё и коды маленьких и больших будут нерегулярно связаы?
Может ну её лесом, эту реформу?
Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском
Re[4]: А зачем русским буквам отдельные символы?
От: vsb Казахстан  
Дата: 11.04.20 23:59
Оценка:
Здравствуйте, Erop, Вы писали:

vsb>>Я имею в виду те буквы, которые не отличаются: AАBВEЕKКMМHНOОPРCСTТXХaаeеoоpрcсyуxх


E>То есть ещё и коды маленьких и больших будут нерегулярно связаы?


Да, так же, как и в некоторых других языках.

E>Может ну её лесом, эту реформу?


Ну понятно, что это надо было делать изначально.
Re[2]: А зачем русским буквам отдельные символы?
От: Erop Россия  
Дата: 12.04.20 00:00
Оценка:
Здравствуйте, pagid, Вы писали:

P>То есть прописные "Т" должны совпадать, а строчные "т" и "t" быть разными. Это просто праздник какой-то получится.


Почему только Т?

Hh vs Нн
Rr vs Гг
Yy vs Уу

И это ещё без курсивных написаний. Там "Т" может и рекордсмен по путанице будет
Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском
Re[3]: А зачем русским буквам отдельные символы?
От: Erop Россия  
Дата: 12.04.20 00:07
Оценка:
Здравствуйте, vsb, Вы писали:

vsb>PS моё предложение хорошо ещё тем, что научило бы русских программистов правильно работать с юникодом.


История показывает, что насильно учить русских чему-то, чему они учиться не хотят -- занятие пустое, и чреватое гибелью от меча...
Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском
Re[3]: А зачем русским буквам отдельные символы?
От: Erop Россия  
Дата: 12.04.20 00:09
Оценка:
Здравствуйте, Cyberax, Вы писали:

P>>То есть прописные "Т" должны совпадать, а строчные "т" и "t" быть разными. Это просто праздник какой-то получится.

C>В турецком именно так, строчная i в заглавной форме — İ.

Вот хрень какая-то и вышла. А была бы у турок своя и такая и своя и сякая. И было бы им счастье...
Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском
Re[5]: А зачем русским буквам отдельные символы?
От: Erop Россия  
Дата: 12.04.20 00:12
Оценка:
Здравствуйте, Mamut, Вы писали:

M>А какие решения ты предложишь? В турецком «и-с-точкой» (читается как «и») и «и-без-точки» (читается, как «ы») — две абсолютно разные буквы, со всем вытекающим.


Ну иметь ДВЕ турецкие буквы "турецкая и с точкой" и "турецкая и без точки", так же, как есть русская О, латинская O, и ещё 0 в придачу...
Или есть латинская l и 1
Почему было и туркам не завести ДВЕ новые свои буквы и не страдать с перекодировками и сменами регистра?
Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском
Re: А зачем русским буквам отдельные символы?
От: Erop Россия  
Дата: 12.04.20 00:19
Оценка:
Здравствуйте, vsb, Вы писали:

vsb>К примеру в казахском языке используются русские буквы плюс 9 своих, никто эти русские буквы в таблице символов не дублирует. Вроде бы то же самое относится к европейским языкам, там тоже используются латинские буквы + несколько своих.


Кайне проблемен. Как только смёржишь 0 с латинской O большой и 1 с латинской l малой, так сразу и приходи.
Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском
Re[2]: А зачем русским буквам отдельные символы?
От: Poopy Joe Бельгия  
Дата: 12.04.20 09:04
Оценка:
Здравствуйте, Mihas, Вы писали:

M>Здравствуйте, vsb, Вы писали:


M>Где-то я такое уже видел. Русские буквы насильно заменялись латинскими, если начертание совпадает.

В FIDO?!
Re[5]: А зачем русским буквам отдельные символы?
От: Mamut Швеция http://dmitriid.com
Дата: 12.04.20 09:10
Оценка:
M>>При том, что уже сейчас средний программист не может нормально обработать ситуации с «ё»: https://i.imgur.com/SMv1728.png

vsb>А в моём варианте сможет. Это "удобная" русская кодировка провоцирует писать такой код. Не было бы её, не было бы такого кода.


Расскажи, как твой вариант помог бы. У тебя же буквы будут рандомно раскиданы повсюду.


dmitriid.comGitHubLinkedIn
Re[7]: А зачем русским буквам отдельные символы?
От: Erop Россия  
Дата: 12.04.20 12:10
Оценка:
Здравствуйте, Mamut, Вы писали:

M>Не турки это вводили

А вот это хороший ответ.
В отличии от турок, кириллические-то кодировки вводили советские, так как было удобно им, а не американцам
Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском
Re[7]: А зачем русским буквам отдельные символы?
От: Mamut Швеция http://dmitriid.com
Дата: 12.04.20 13:40
Оценка:
M>>Расскажи, как твой вариант помог бы. У тебя же буквы будут рандомно раскиданы повсюду.

vsb>Помог бы тем, что наивный код вида 'А' <= ch && ch <= 'Я' не сработал бы сразу и разработчику сразу пришлось бы думать о правильном подходе.


Ну и расскажи мне, каким будет правильный подход в условиях, когда буквы рандомно раскиданы по всему алфавиту?


dmitriid.comGitHubLinkedIn
Re[8]: А зачем русским буквам отдельные символы?
От: vsb Казахстан  
Дата: 12.04.20 14:19
Оценка:
Здравствуйте, Mamut, Вы писали:

M>>>Расскажи, как твой вариант помог бы. У тебя же буквы будут рандомно раскиданы повсюду.


vsb>>Помог бы тем, что наивный код вида 'А' <= ch && ch <= 'Я' не сработал бы сразу и разработчику сразу пришлось бы думать о правильном подходе.


M>Ну и расскажи мне, каким будет правильный подход в условиях, когда буквы рандомно раскиданы по всему алфавиту?


"АБВГДЕЁЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯабвгдеёжзийклмнопрстуфхцчшщъыьэюя".indexOf(ch) != -1
Re[9]: А зачем русским буквам отдельные символы?
От: Mamut Швеция http://dmitriid.com
Дата: 12.04.20 14:40
Оценка:
vsb>>>Помог бы тем, что наивный код вида 'А' <= ch && ch <= 'Я' не сработал бы сразу и разработчику сразу пришлось бы думать о правильном подходе.

M>>Ну и расскажи мне, каким будет правильный подход в условиях, когда буквы рандомно раскиданы по всему алфавиту?


vsb>
"АБВГДЕЁЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯабвгдеёжзийклмнопрстуфхцчшщъыьэюя".indexOf(ch) != -1



То есть ты предлагаешь вручную вбивать весь алфавит? Ладно, простейший случай ты криво, но решил. Что будем делать с сортировкой?


dmitriid.comGitHubLinkedIn
Re[10]: А зачем русским буквам отдельные символы?
От: vsb Казахстан  
Дата: 12.04.20 19:41
Оценка:
Здравствуйте, Mamut, Вы писали:

vsb>>>>Помог бы тем, что наивный код вида 'А' <= ch && ch <= 'Я' не сработал бы сразу и разработчику сразу пришлось бы думать о правильном подходе.


M>>>Ну и расскажи мне, каким будет правильный подход в условиях, когда буквы рандомно раскиданы по всему алфавиту?


vsb>>
"АБВГДЕЁЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯабвгдеёжзийклмнопрстуфхцчшщъыьэюя".indexOf(ch) != -1



M>То есть ты предлагаешь вручную вбивать весь алфавит?


Ну вообще я рассчитывал, что в Java это есть из коробки, но не нашёл. Возможно надо подключить библиотеку ICU, лень смотреть, никогда с ней не работал.

> Ладно, простейший случай ты криво, но решил.


Почему криво?

> Что будем делать с сортировкой?


А тут всё отлично:

        Locale locale = Locale.forLanguageTag("ru");
        Collator collator = Collator.getInstance(locale);
        System.out.println(locale);
        System.out.println(collator.compare("А", "Ё"));
        System.out.println(collator.compare("Ё", "Я"));


А что ты делаешь сейчас без специального API? Делаешь вид, что буквы "ё" не существует?
Re[5]: А зачем русским буквам отдельные символы?
От: pagid Россия  
Дата: 13.04.20 06:31
Оценка:
Здравствуйте, Cyberax, Вы писали:

C>Но в итоге получилась смесь всего со всем, в которой нереально разобраться без пары кубов очень крепкого наркотика.

Получилась вполне логичная смесь основанная на предыдущей практике. Не без недостатков и проблем, но минимизируя их.

Польскую "А" не никакого смысла отделять от латинской "А" потому как польский алфавит это вариант латиницы, а её варианты, отличаются друг от друга лишь наличием (да и то не так уж и часто) дополнительных букв. С кириллицей все точно так же, но иногда дополнительных букв побольше. С китайским и японским ничего не скажу, для меня они лишь выглядят чуть по разному, но возможно это решается шрифтами с разным начертанием.
Re[6]: А зачем русским буквам отдельные символы?
От: Privalov  
Дата: 14.04.20 20:11
Оценка:
Здравствуйте, Erop, Вы писали:

M>>https://ru.wikipedia.org/wiki/Метакса


E>Точно -- ОН!!!


Если он куплен в Греции, то вполне приличный напиток. А если за ее пределами, то можно на стекломой в красивой упаковке нарваться.
Re[7]: А зачем русским буквам отдельные символы?
От: Erop Россия  
Дата: 15.04.20 07:32
Оценка:
Здравствуйте, Privalov, Вы писали:

P>Если он куплен в Греции, то вполне приличный напиток. А если за ее пределами, то можно на стекломой в красивой упаковке нарваться.

Всё так, но смысл брать в Греции метаксу, когда всюду есть узо?
Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском
Re[8]: А зачем русским буквам отдельные символы?
От: Privalov  
Дата: 16.04.20 06:41
Оценка:
Здравствуйте, Erop, Вы писали:

E>Всё так, но смысл брать в Греции метаксу, когда всюду есть узо?


Узо — это что-то типа водки, не? И зачем водку тащить? Своей нету что ли? К тому же водка — это не мое.

А еще есть ракия, которая тоже иногда бывает ничего. Если на разлив.

Но вообще-то речь шла собственно о напитке, а не зачем его покупать.
Re[9]: А зачем русским буквам отдельные символы?
От: Erop Россия  
Дата: 17.04.20 07:17
Оценка:
Здравствуйте, Privalov, Вы писали:

P>Узо — это что-то типа водки, не? И зачем водку тащить? Своей нету что ли? К тому же водка — это не мое.

Куда тащить?

P>А еще есть ракия, которая тоже иногда бывает ничего. Если на разлив.

Ракия -- это такая смягчённая версия узо.

P>Но вообще-то речь шла собственно о напитке, а не зачем его покупать.

Речь шла о "Метаксе, если её покупать в Греции". Я вот не понимаю, если ты уже в Греции, то зачем там покупать Метаксу вместо узо.
Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском
Re[10]: А зачем русским буквам отдельные символы?
От: Mamut Швеция http://dmitriid.com
Дата: 17.04.20 07:54
Оценка:
P>>А еще есть ракия, которая тоже иногда бывает ничего. Если на разлив.
E>Ракия -- это такая смягчённая версия узо.

Это все напитки с анисом (мерзкая гадость, на мой вкус). Где с добавлением сахара, где без

Греция: узо и
Болгария: ракия и мастика
Турция: ракы
Италия: самбука
Франция: пастис
Испания: пачаран

и т.п.


dmitriid.comGitHubLinkedIn
Re[10]: А зачем русским буквам отдельные символы?
От: Privalov  
Дата: 17.04.20 08:28
Оценка:
Здравствуйте, Erop, Вы писали:

E>Речь шла о "Метаксе, если её покупать в Греции". Я вот не понимаю, если ты уже в Греции, то зачем там покупать Метаксу вместо узо.


Я писал раньше:

Если он куплен в Греции, то вполне приличный напиток. А если за ее пределами, то можно на стекломой в красивой упаковке нарваться.


Потому что хочется иногда и дома попить нормальной Метаксы, а не того стекломоя, которым торгуют в ближайшей лавке.
Re[11]: А зачем русским буквам отдельные символы?
От: Privalov  
Дата: 17.04.20 08:45
Оценка:
Здравствуйте, Mamut, Вы писали:

M>Это все напитки с анисом (мерзкая гадость, на мой вкус). Где с добавлением сахара, где без


Все эти кодировки, оказывается, сложны до такой степени, что без бутылки не разберешься. Да еще содержимое имеет значение.

M>Греция: узо и

M>Болгария: ракия и мастика

В Болгарии мне очень нравился "Сълнчев бряг". Я когда-то привез из Велико-Тырново пару бутылок. Он тоже не имел ничего общего с тем пойлом, которым торговали в ближайшей лавке. Даже этикетки разные.
Re[7]: А зачем русским буквам отдельные символы?
От: Privalov  
Дата: 17.04.20 08:46
Оценка:
Здравствуйте, Ops, Вы писали:

Ops>Вот буржуй. А мы слынчев бряг тогда глотали, та еще тормозуха.


Это потому что вы глотали слынчев бряг, а не "Сълнчев бряг".
Re[8]: А зачем русским буквам отдельные символы?
От: Ops Россия  
Дата: 17.04.20 09:01
Оценка:
Здравствуйте, Privalov, Вы писали:

P>Это потому что вы глотали слынчев бряг, а не "Сълнчев бряг".


Что было в палатках, то и глотали. Мы болгарскому (или какая там страна декларировалась?) не обучены, в правописание не вникали.
Переубедить Вас, к сожалению, мне не удастся, поэтому сразу перейду к оскорблениям.
Отредактировано 17.04.2020 9:08 ути-пути . Предыдущая версия .
Re[9]: А зачем русским буквам отдельные символы?
От: Privalov  
Дата: 17.04.20 09:15
Оценка:
Здравствуйте, Ops, Вы писали:

Ops>Что было в палатках, то и глотали. Мы болгарскому (или какая там страна декларировалась?) не обучены, в правописание не вникали.


Видимо, мне больше повезло. Еще в школе с нами болгары учились. Их родители на каких-то объектах работали. От них мы узнали, что "Ъ" — это О краткое.
А в Болгарии все прекрасно понимали русский. В принципе, можно разобрать болгарский, если говорят медленно. Единственное, что сносило крышу, это когда они на "да" качают головой, а на "нет" — кивают.
Re[10]: А зачем русским буквам отдельные символы?
От: Ops Россия  
Дата: 17.04.20 09:22
Оценка:
Здравствуйте, Privalov, Вы писали:

P>Видимо, мне больше повезло. Еще в школе с нами болгары учились. Их родители на каких-то объектах работали. От них мы узнали, что "Ъ" — это О краткое.


А мне не довелось изучить письменный. Вроде ту бормотуху еще и с латиницей в названии продавали, и я сейчас не вспомню, как именно все варианты писались. Помню только, что она не сразу стала совсем не питьевой.

P>А в Болгарии все прекрасно понимали русский. В принципе, можно разобрать болгарский, если говорят медленно. Единственное, что сносило крышу, это когда они на "да" качают головой, а на "нет" — кивают.


Это разговорный.
Переубедить Вас, к сожалению, мне не удастся, поэтому сразу перейду к оскорблениям.
Re[11]: А зачем русским буквам отдельные символы?
От: Erop Россия  
Дата: 17.04.20 09:38
Оценка:
Здравствуйте, Privalov, Вы писали:

P>Потому что хочется иногда и дома попить нормальной Метаксы, а не того стекломоя, которым торгуют в ближайшей лавке.


Во-о-от. Тебе она таки нравится. А меня буржуем за что-то обзывают... "С" == справедливость...
Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском
Re[11]: А зачем русским буквам отдельные символы?
От: Privalov  
Дата: 17.04.20 10:02
Оценка:
Здравствуйте, Ops, Вы писали:

Ops>А мне не довелось изучить письменный. Вроде ту бормотуху еще и с латиницей в названии продавали, и я сейчас не вспомню, как именно все варианты писались. Помню только, что она не сразу стала совсем не питьевой.


Да помню. Я как-то взял бутылку, не очень внимательно рассмотрев этикетку. Испытал шок. Потом уже сравнил с настоящей, из Болгарии.

Из письменного болгарского я только "Ъ" знаю. Произведения Богомила Райнова я читал в русском и украинском переводах.
Re[5]: А зачем русским буквам отдельные символы?
От: kov_serg Россия  
Дата: 08.06.20 13:21
Оценка:
Здравствуйте, vsb, Вы писали:

vsb>Здравствуйте, kov_serg, Вы писали:


vsb>>>Idea умеет?


_>>Settings > Inspections > Internationalization > Non-ASCII characters


vsb>Так мне похожие надо, а не все. В данном случае не поможет, у меня эти символы в строке были, а не в идентификаторе (и вообще не в проекте, а в отдельном файле, на него инспекции идея не показывает).


Можно все файлы проверить так например:
grep -Pn "(\w+[^\0-\x7F]|[^\0-\x7F]+\w)" -R .
Re[4]: А зачем русским буквам отдельные символы?
От: netch80 Украина http://netch80.dreamwidth.org/
Дата: 09.06.20 05:30
Оценка:
Здравствуйте, Mystic Artifact, Вы писали:

MA>Здравствуйте, vsb, Вы писали:


vsb>>Я имею в виду те буквы, которые не отличаются: AАBВEЕKКMМHНOОPРCСTТXХaаeеoоpрcсyуxх

MA> Присмотритесь внимательно к начертаниям, например, русской К и латинской K, в разных шрифтах без засечек. Они отличаются и существенно. Неужто уже позабывали как "нормальные" русские глифы выглядят?


Некорректно, потому что зависит от шрифтов. В одних различается, в других нет. Различаться не обязаны. Более того, 99% читающих через секунду уже не вспомнят, что было различие, они смотрят на букву, а оформление воздействует только косвенно.
The God is real, unless declared integer.
Re[11]: А зачем русским буквам отдельные символы?
От: netch80 Украина http://netch80.dreamwidth.org/
Дата: 09.06.20 05:33
Оценка:
Здравствуйте, Privalov, Вы писали:

P>Ты будешь смеяться, для сортировки украинских фамилий в алфавитном порядке я вбивал руками украинский алфавит. Точнее, строил таблицу:

P>
P>А Б В Г Д Е Є ... я
P>1 2 3 4 5 6 7 ... 70
P>

P>Каждой букве ставил в соответствие число. Потому что иначе пришлось бы делать весьма нетривиальную обработку букв ЄєІіЇї, которые стоят в стороне. Кстати, с буквой Ё та же история.

Я код для основного диапазона умножал на 10 (А — 10, Б — 20, итд), а буквы типа єї получали смещённые числа.
Было хорошо, кроме того, что "ь" приходилось перемещать, одно время был нормой порядок алфавита, где он после "я".

P>Причем сортировка по такой таблице еще и не очень тормозила.

P>Веселее было другое. Я в то время встречал не меньше трех вариантов кодировки украинского языка. Попробуй импорт данных в таких условиях сделать.

Да, тут уже надо было вероятности считать.
The God is real, unless declared integer.
Re[5]: А зачем русским буквам отдельные символы?
От: netch80 Украина http://netch80.dreamwidth.org/
Дата: 09.06.20 05:40
Оценка:
Здравствуйте, Cyberax, Вы писали:

C>Логичный Юникод можно было бы делать двумя фундаментально разными способами:

C>1. Объединить графически одинаковые символы в одном коде. Затем для преобразования строчных в прописные буквы использовать языково-специфичные таблицы (которые всё равно нужны).
C>2. Разделить каждый национальный алфавит в свой диапазон. Т.е. чтобы польская A отличалась от латинской A, а китайский "喝" отличался от японского "喝" (который я даже сюда скопировать не могу, оно заменяется на китайский).

Завтра канонинизируют какой-нибудь нижнеморавский — ему тоже полностью свои буквы вводить?

C>Но в итоге получилась смесь всего со всем, в которой нереально разобраться без пары кубов очень крепкого наркотика.


Второй вариант точно был бы хуже. Первый — надо подумать, но что свои грабли есть — к гадалке не ходи.
The God is real, unless declared integer.
Re[12]: А зачем русским буквам отдельные символы?
От: Privalov  
Дата: 09.06.20 06:54
Оценка:
Здравствуйте, netch80, Вы писали:

N>Я код для основного диапазона умножал на 10 (А — 10, Б — 20, итд), а буквы типа єї получали смещённые числа.


Да? ЕМНИП, эти буквы находились в теблице после "я". Соответственно при умножении они все равно остались бы на своих местах. Или я чего-то не понял.

N>Было хорошо, кроме того, что "ь" приходилось перемещать, одно время был нормой порядок алфавита, где он после "я".


Это да, в украинском алфавите "ь" — последняя буква. Но этот факт я проигнорировал, там все прокатывало почти незаметно. В глаза не бросалось. С ЄЇ все было заметно хуже.
Re[13]: А зачем русским буквам отдельные символы?
От: netch80 Украина http://netch80.dreamwidth.org/
Дата: 09.06.20 15:00
Оценка:
Здравствуйте, Privalov, Вы писали:

N>>Я код для основного диапазона умножал на 10 (А — 10, Б — 20, итд), а буквы типа єї получали смещённые числа.


P>Да? ЕМНИП, эти буквы находились в теблице после "я". Соответственно при умножении они все равно остались бы на своих местах. Или я чего-то не понял.


Для єї... номера менялись — если е это 60 потому что 6*10, то є получало 65 по подстановке, и т.д. На самом деле брались коды CP866 после приведения регистра, так что там были коды типа 2130 для е (213*10) и 2135 для є.

N>>Было хорошо, кроме того, что "ь" приходилось перемещать, одно время был нормой порядок алфавита, где он после "я".


P>Это да, в украинском алфавите "ь" — последняя буква.


Уже нет.
The God is real, unless declared integer.
Re: А зачем русским буквам отдельные символы?
От: BOBKA_XPEH Новая Зеландия  
Дата: 09.06.20 20:56
Оценка:
Здравствуйте, vsb, Вы писали:


vsb>К примеру в казахском языке используются русские буквы плюс 9...


Вчи украинскую мову! А по meме дepжume Hapkoмана!
Гей хлопци — шлях в Европу!
Re[2]: А зачем русским буквам отдельные символы?
От: BOBKA_XPEH Новая Зеландия  
Дата: 09.06.20 21:14
Оценка:
Здравствуйте, anonymouse2, Вы писали:

A>Подумал тут вот о чем.


У тебя все мысли об одном, шалунишка! Гeu xлonцu це Эвропа!

A>А зачем заглавным буквами..


ябыещезнакипрепонанияотменил
Гей хлопци — шлях в Европу!
Re[6]: А зачем русским буквам отдельные символы?
От: Ilya81  
Дата: 10.06.20 15:48
Оценка:
Здравствуйте, Stanislav V. Zudin, Вы писали:

SVZ>Не так уж и хорошо умеет, как оказалось.

SVZ>Почти год назад сортировка у многих языков не соответствовала стандарту. Может чего поправили, но я не проверял.

Кстати, стандарт сортировки бывает очень разным. Например, в испанском языке ch — отдельная буква, так что ch будет после, например, cr.
Re: А зачем русским буквам отдельные символы?
От: Head Ache  
Дата: 13.06.20 15:11
Оценка:
Здравствуйте, vsb, Вы писали:

vsb>Тут в очередной раз наслаждаюсь отловом бага, когда в коде написано Tехосмотр (первая буква латинская). И возник вопрос, а зачем вообще этим буквам назначили отдельные коды? Во всех шрифтах, которые я видел, латинская T и русская Т полностью идентичны. Не разумней было бы назначить отдельные символы только тем буквам, которые отличаются от латинских? Тут даже цель не в экономии битов, а именно в исключении ситуации, когда выглядит одинаково, а коды разные.


К и Д например — что с ними делать?
Что делать с рукописными шрифтами.
Цель не ограничивать бессмысленно разработчиков шрифта. А не исключение "ситуаций".
Этот аккаунт покинут.
Re: Хрен с ним с буквами. Зачем столько переводов строк?
От: kov_serg Россия  
Дата: 26.06.20 09:37
Оценка:
Здравствуйте, vsb, Вы писали:

vsb>Тут в очередной раз наслаждаюсь отловом бага...


Хрен с ним с буквами. Зачем столько переводов строк:

https://www.fileformat.info/info/unicode/char/000A/index.htm
https://www.fileformat.info/info/unicode/char/000D/index.htm
https://www.fileformat.info/info/unicode/char/0085/index.htm
https://www.fileformat.info/info/unicode/char/2028/index.htm
https://www.fileformat.info/info/unicode/char/2029/index.htm
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.