Здравствуйте, Mamut, Вы писали:
vsb>>Я имею в виду те буквы, которые не отличаются: AАBВEЕKКMМHНOОPРCСTТXХaаeеoоpрcсyуxх
M>И? То, что они не отличаются в компьютерных шрифтах, говорит только о том, что компьютеры в целом убили понятие типографики.
Ну и ладно.
M>И, вдобавок, у тебя внезапно на ровном месте появляется дополнительные сложности для обработки таких текстов:
M>- B это заглавная от б или b?
M>- T это заглавная от t или т?
M>- P — это «эр» или «пэ»?
Не представляю задач, когда мне это может понадобиться.
M>Это не говоря о диком усложнении программ на ровном месте.
Нет никакого усложнения. Всё остаётся ровно так же, как сейчас (если нормально поддерживать интернационализацию, а не только для русского и английского).
M>При том, что уже сейчас средний программист не может нормально обработать ситуации с «ё»: https://i.imgur.com/SMv1728.png
А в моём варианте сможет. Это "удобная" русская кодировка провоцирует писать такой код. Не было бы её, не было бы такого кода.
M>Это не говоря о том, что у тебя исключительно «западный» взгляд на вещи. Предлагаешь, например, так же объединить:
M>- Փ ARMENIAN CAPITAL LETTER PIWR
M>- օ ARMENIAN SMALL LETTER OH
M>- ০ BENGALI DIGIT ZERO
M>- ৪ BENGALI DIGIT FOUR
M>- 𑄽 CHAKMA DIGIT SEVEN
M>- ᱛ OL CHIKI LETTER AT
M>- ᳃ SUNDANESE PUNCTUATION BINDU CAKRA
M>- ᩅ TAI THAM LETTER WA
M>- ቀ ETHIOPIC SYLLABLE QA
M>- Ᏼ CHEROKEE LETTER YV
M>- Ꭲ CHEROKEE LETTER I
M>- Ꭼ CHEROKEE LETTER GV
M>- Ꭺ CHEROKEE LETTER GO
Думаю, каждый случай нужно рассматривать отдельно. В целом да, если два символа рисуются идентично, они должны использовать один код. Ещё, кстати, букву "ё" как букву с отдельным кодом тоже надо выкинуть. Правильная ё должна получаться через "е" + U+0308: "ё".