Здравствуйте, Cyberax, Вы писали:
V>>> Каждый файл редактировался в блокноте, который ставитл свой тупой BOM, и в результате BOM появлялся посередине документов. CC>>А еслиб там было несколько файлов и все в разных UTF кодировках с разными Endian то какое гуано из этого слепил бы тот фреймворк? C>В UTF-кодировках отсутствует endian. BOM позволяет лишь помечать файлы, как содержащие UTF, а посему смысла не имеет.
Драаааасте. BOM расшифровывается как Byte Order Mark. http://unicode.org/faq/utf_bom.html
Q: What are some of the differences between the UTFs?
In the table <BOM> indicates that the byte order is determined by a byte order mark, if present at the beginning of the data stream, otherwise it is big-endian.
C>И да, я реально имел проблемы из-за BOM'а, который вставляет Notepad.
Я не имел никогда, ибо правильно написаный reader детектит BOM и преобразует входящий поток в тот вид, который требуется.
... << RSDN@Home 1.1.4 stable SR1 rev. 568>>
Забанили по IP, значит пора закрыть эту страницу.
Всем пока
Здравствуйте, Sergei I. Gorelkin, Вы писали:
H>>>Блокнот еще вставляет в начало юникод файла 3 байта из-за чего ломает остальные программы CC>>Это называется Unicode BOM и вообще то должен там быть по стандарту. CC>>Эти "остальные программы" пора на помойку.
SIG>По стандарту BOM должен быть в кодировках UTF-16BE и UTF16-LE. SIG>Традиция впихивания "BOM" в UTF-8 пошла от M$, которым, видимо, поступить так показалось проще, чем фиксить свою реализацию IsTextUnicode(), о глюкавости которой ходят легенды.
Не надо фантазий. Он не обязателен, но UTF8 BOM не хотелка МС а пункт Unicode стандарта. http://unicode.org/faq/utf_bom.html#utf8-2
Q: Is the UTF-8 encoding scheme the same irrespective of whether the underlying processor is little endian or big endian?
A: Yes. Since UTF-8 is interpreted as a sequence of bytes, there is no endian problem as there is for encoding forms that use 16-bit or 32-bit code units. Where a BOM is used with UTF-8, it is only used as an ecoding signature to distinguish UTF-8 from other encodings — it has nothing to do with byte order
Поэтому если программа не понимает UTF8 BOM — она не соответствует стандарту.
Касательно Notepad. Он умеет писать/читать UTF8, UTF16LE и UTF16BE. И совершенно правильно что он пишет BOM, который указывает как тип UTF так и endianness.
... << RSDN@Home 1.1.4 stable SR1 rev. 568>>
Забанили по IP, значит пора закрыть эту страницу.
Всем пока
Здравствуйте, CreatorCray, Вы писали:
C>>В UTF-кодировках отсутствует endian. BOM позволяет лишь помечать файлы, как содержащие UTF, а посему смысла не имеет. CC>Драаааасте. BOM расшифровывается как Byte Order Mark.
Сорри, надо было уточнить — в UTF-8 нет endianness'а. В UTF-16/32 она есть, но тут речь в треде идёт об UTF-8.
C>>И да, я реально имел проблемы из-за BOM'а, который вставляет Notepad. CC>Я не имел никогда, ибо правильно написаный reader детектит BOM и преобразует входящий поток в тот вид, который требуется.
Для UTF-8 нафиг этот BOM не нужен.
Здравствуйте, McSeem2, Вы писали:
MS>Аааааа! Все гораздо хуже! Оно принципиально не хочет играть 96КГц сапмл-рейт! MS>А это, на самом деле — потеря маркета, бездарная и тупая.
а объём этого маркета в деньгах не скажешь?
Здравствуйте, Antikrot, Вы писали:
MS>>А это, на самом деле — потеря маркета, бездарная и тупая. A>а объём этого маркета в деньгах не скажешь?
Легко. Надо посчитать количество ночных клубов по всему миру и умножить на 2 или 3 — столько диджеев нужно для его нормального функционирования. По-моему, вполне приличные деньги. А тут такое...
McSeem
Я жертва цепи несчастных случайностей. Как и все мы.
Здравствуйте, Cyberax, Вы писали:
C>Здравствуйте, CreatorCray, Вы писали:
C>>>В UTF-кодировках отсутствует endian. BOM позволяет лишь помечать файлы, как содержащие UTF, а посему смысла не имеет. CC>>Драаааасте. BOM расшифровывается как Byte Order Mark. C>Сорри, надо было уточнить — в UTF-8 нет endianness'а. В UTF-16/32 она есть, но тут речь в треде идёт об UTF-8.
А что, в UTF8 нет многобайтных символов?
[In theory there is no difference between theory and practice. In
practice there is.]
[Даю очевидные ответы на риторические вопросы]
Здравствуйте, Vain, Вы писали:
C>>>>В UTF-кодировках отсутствует endian. BOM позволяет лишь помечать файлы, как содержащие UTF, а посему смысла не имеет. CC>>>Драаааасте. BOM расшифровывается как Byte Order Mark. C>>Сорри, надо было уточнить — в UTF-8 нет endianness'а. В UTF-16/32 она есть, но тут речь в треде идёт об UTF-8. V>А что, в UTF8 нет многобайтных символов?
UTF-8 определена в терминах потока октетов. Так что вопросов с endianness'ом не возникает.
Вот UTF-16/32 определены в терминах 16- и 32-битных codepoint'ов. Отсюда и проблемы с порядком байт.
Здравствуйте, CreatorCray, Вы писали:
CC>Не надо фантазий. Он не обязателен, но UTF8 BOM не хотелка МС а пункт Unicode стандарта. CC>http://unicode.org/faq/utf_bom.html#utf8-2 CC>
CC>Q: Is the UTF-8 encoding scheme the same irrespective of whether the underlying processor is little endian or big endian?
CC>A: Yes. Since UTF-8 is interpreted as a sequence of bytes, there is no endian problem as there is for encoding forms that use 16-bit or 32-bit code units. Where a BOM is used with UTF-8, it is only used as an ecoding signature to distinguish UTF-8 from other encodings — it has nothing to do with byte order
CC>Поэтому если программа не понимает UTF8 BOM — она не соответствует стандарту.
Во-первых, BOM опционален.
Во-вторых, стандарт в этом месте абсолютно идиотский. Скажем, непонятно как обрабатывать пустые файлы. Непонятно как быть с конкатенацией и т.п. Так что решение "не реализовывать BOM для UTF-8" — это абсолютно правильное поведение на практике.
Попытки оправдания глючного на практике поведения — это бессмысленный "standards lawyering".
Здравствуйте, McSeem2, Вы писали:
MS>>>А это, на самом деле — потеря маркета, бездарная и тупая. A>>а объём этого маркета в деньгах не скажешь? MS>Легко. Надо посчитать количество ночных клубов по всему миру и умножить на 2 или 3 — столько диджеев нужно для его нормального функционирования.
даже если пересчитать линуксоидов, и то на порядки больше будет
Здравствуйте, Cyberax, Вы писали:
CC>>Поэтому если программа не понимает UTF8 BOM — она не соответствует стандарту. C>Во-первых, BOM опционален.
Опционален означает: может быть а может не быть.
Поэтому если прога не работает правильно если он всё таки есть то она стандарту не соответствует.
C>Во-вторых, стандарт в этом месте абсолютно идиотский. Скажем, непонятно как обрабатывать пустые файлы.
Никак. Он пустой.
C> Непонятно как быть с конкатенацией и т.п.
Читаем BOM, если он есть то конвертим входящий поток в тот вид, с которым объединяем. Если его нет — считаем что он в том же формате что и остальные данные.
C> Так что решение "не реализовывать BOM для UTF-8" — это абсолютно правильное поведение на практике.
Это халтура.
... << RSDN@Home 1.1.4 stable SR1 rev. 568>>
Забанили по IP, значит пора закрыть эту страницу.
Всем пока
Здравствуйте, Mr.Cat, Вы писали:
MC>Здравствуйте, Don Reba, Вы писали: DR>>Ну и MSPaint не поддерживает 16-битные каналы. Что-ж тут удивительного? MC>Ну вот и зачем в поставке винды весь этот недософт? Если ms невыгодно поддерживать эти продукты — может, стоило просто упростить установку их бесплатных продвинутых аналогов (paint.net/gimp вместо mspaint, notepad++ вместо notepad и т.п.)?
Скорее всего, выгодно было бы включить MS Office прямо в винду, но тут же поднимется вой дикий, потому что начнет умирать Open Office. Всё остальное точно так же. Был бы развитый Paintbrush, начиная с Windows 3.0, не было бы сейчас в природе ни GIMP, ни Paint.NET.
Здравствуйте, Sharowarsheg, Вы писали: S>Скорее всего, выгодно было бы включить MS Office прямо в винду ... Был бы развитый Paintbrush
Да какая разница, что было бы? Я про то, что сейчас безо всяких бы с виндой идет куча ненужного софта. От замены его на что-то более достойное винда бы только выиграла.
Здравствуйте, blackhearted, Вы писали: B>Довольно критичны, особенно для совсем простых пользователей, которым даже скайп поставить нужно. Они-то как раз в нотепаде и пишут, и копируют туда.
Ну писали бы в нотепаде++ — он ничем не хуже и даже лучше.
Здравствуйте, March_rabbit, Вы писали: M_>думаю, с тех самых, когда про винду стали судить по качеству этих компонентов
Да это ж какбы тенденция, что стандартный виндовый софт — полное дерьмо. Как было бы хорошо, если б в ОСи искаропки шел некий набор софта (KDE вот верной дорогой идет, хотя браузер у них до сих пор тот еще треш).
Здравствуйте, CreatorCray, Вы писали:
C>>Во-вторых, стандарт в этом месте абсолютно идиотский. Скажем, непонятно как обрабатывать пустые файлы. CC>Никак. Он пустой.
Нет. В нём BOM. А может и не BOM.
С точки зрения пользовательского уровня может оказаться, что пустые файлы — вовсе не пустые на диске.
C>> Непонятно как быть с конкатенацией и т.п. CC>Читаем BOM, если он есть то конвертим входящий поток в тот вид, с которым объединяем. Если его нет — считаем что он в том же формате что и остальные данные.
Т.е. cat'ом объединить файлы уже нельзя. Нужно процессить BOM. А если это бинарный файл со случайно оказавшимся BOM'ом?
C>> Так что решение "не реализовывать BOM для UTF-8" — это абсолютно правильное поведение на практике. CC>Это халтура.
Нет, это правильное решение.
Здравствуйте, Cyberax, Вы писали: C>Вот UTF-16/32 определены в терминах 16- и 32-битных codepoint'ов. Отсюда и проблемы с порядком байт.
Кстати, интересно а где-нибудь вообще оправдано хранение текста в utf-16/32? Вроде ведь все идет к тому, что utf-8 всех зарулит? Не?
Здравствуйте, Mr.Cat, Вы писали:
MC>Здравствуйте, Sharowarsheg, Вы писали: S>>Скорее всего, выгодно было бы включить MS Office прямо в винду ... Был бы развитый Paintbrush MC>Да какая разница, что было бы? Я про то, что сейчас безо всяких бы с виндой идет куча ненужного софта. От замены его на что-то более достойное винда бы только выиграла.
Антимонопольный комитет не разрешит. Даже на браузер и на тот бычат.
Здравствуйте, Константин Б., Вы писали:
КБ>Здравствуйте, Nik_1, Вы писали:
N_>>Здравствуйте, Константин Б., Вы писали: КБ>>>А кто в здравом уме будет хранить музыку в некомпрессированных wav файлах? N_>>А что, тормозплеервмплеер уже научился флак с апе поддерживать?
КБ>Объясните пожалуйста связь вашего вопроса с моим.
А ты обьясни смысл своего вопроса К чему ты это написал про вав?
А в чем же тогда "в здравом уме" потвоему хранят музыку, и чтоб этот формат поддерживал тормазплеер.
Здравствуйте, Nik_1, Вы писали:
N_>Здравствуйте, Константин Б., Вы писали:
КБ>>Здравствуйте, Nik_1, Вы писали:
N_>>>Здравствуйте, Константин Б., Вы писали: КБ>>>>А кто в здравом уме будет хранить музыку в некомпрессированных wav файлах? N_>>>А что, тормозплеервмплеер уже научился флак с апе поддерживать?
КБ>>Объясните пожалуйста связь вашего вопроса с моим. N_>А ты обьясни смысл своего вопроса К чему ты это написал про вав?
Ну WMP — программа для проигрывания музыки. Проигрывать ей не музыку — глупо. Хранить музыку в некомпрессированном Wav — глупо вдвойне.
N_>А в чем же тогда "в здравом уме" потвоему хранят музыку, и чтоб этот формат поддерживал тормазплеер.
Из коробки или кодеки разрешено устанавливать? Ну вообще mp3 обычно.
Здравствуйте, Константин Б., Вы писали: КБ>Ну WMP — программа для проигрывания музыки. Проигрывать ей не музыку — глупо. Хранить музыку в некомпрессированном Wav — глупо вдвойне. КБ>Из коробки или кодеки разрешено устанавливать? Ну вообще mp3 обычно.
Попробуй послушать музыку на нормальных колонках и тогда не будешь писать подобных глупостей.
Если на твоих пишалках раздници между мп3 и несжатым форматом неслышно, это не значит что ее нет на нормальных колонках