Re[8]: Удивительная винда
От: CreatorCray  
Дата: 10.07.10 10:51
Оценка:
Здравствуйте, Cyberax, Вы писали:

V>>> Каждый файл редактировался в блокноте, который ставитл свой тупой BOM, и в результате BOM появлялся посередине документов.

CC>>А еслиб там было несколько файлов и все в разных UTF кодировках с разными Endian то какое гуано из этого слепил бы тот фреймворк?
C>В UTF-кодировках отсутствует endian. BOM позволяет лишь помечать файлы, как содержащие UTF, а посему смысла не имеет.
Драаааасте. BOM расшифровывается как Byte Order Mark.
http://unicode.org/faq/utf_bom.html

Q: What are some of the differences between the UTFs?
In the table <BOM> indicates that the byte order is determined by a byte order mark, if present at the beginning of the data stream, otherwise it is big-endian.


C>И да, я реально имел проблемы из-за BOM'а, который вставляет Notepad.

Я не имел никогда, ибо правильно написаный reader детектит BOM и преобразует входящий поток в тот вид, который требуется.
... << RSDN@Home 1.1.4 stable SR1 rev. 568>>
Забанили по IP, значит пора закрыть эту страницу.
Всем пока
Re[6]: Удивительная винда
От: CreatorCray  
Дата: 10.07.10 10:51
Оценка: +1
Здравствуйте, Sergei I. Gorelkin, Вы писали:

H>>>Блокнот еще вставляет в начало юникод файла 3 байта из-за чего ломает остальные программы

CC>>Это называется Unicode BOM и вообще то должен там быть по стандарту.
CC>>Эти "остальные программы" пора на помойку.

SIG>По стандарту BOM должен быть в кодировках UTF-16BE и UTF16-LE.

SIG>Традиция впихивания "BOM" в UTF-8 пошла от M$, которым, видимо, поступить так показалось проще, чем фиксить свою реализацию IsTextUnicode(), о глюкавости которой ходят легенды.
Не надо фантазий. Он не обязателен, но UTF8 BOM не хотелка МС а пункт Unicode стандарта.
http://unicode.org/faq/utf_bom.html#utf8-2

Q: Is the UTF-8 encoding scheme the same irrespective of whether the underlying processor is little endian or big endian?

A: Yes. Since UTF-8 is interpreted as a sequence of bytes, there is no endian problem as there is for encoding forms that use 16-bit or 32-bit code units. Where a BOM is used with UTF-8, it is only used as an ecoding signature to distinguish UTF-8 from other encodings — it has nothing to do with byte order


Поэтому если программа не понимает UTF8 BOM — она не соответствует стандарту.

Касательно Notepad. Он умеет писать/читать UTF8, UTF16LE и UTF16BE. И совершенно правильно что он пишет BOM, который указывает как тип UTF так и endianness.
... << RSDN@Home 1.1.4 stable SR1 rev. 568>>
Забанили по IP, значит пора закрыть эту страницу.
Всем пока
Re[9]: Удивительная винда
От: Cyberax Марс  
Дата: 10.07.10 12:23
Оценка:
Здравствуйте, CreatorCray, Вы писали:

C>>В UTF-кодировках отсутствует endian. BOM позволяет лишь помечать файлы, как содержащие UTF, а посему смысла не имеет.

CC>Драаааасте. BOM расшифровывается как Byte Order Mark.
Сорри, надо было уточнить — в UTF-8 нет endianness'а. В UTF-16/32 она есть, но тут речь в треде идёт об UTF-8.

C>>И да, я реально имел проблемы из-за BOM'а, который вставляет Notepad.

CC>Я не имел никогда, ибо правильно написаный reader детектит BOM и преобразует входящий поток в тот вид, который требуется.
Для UTF-8 нафиг этот BOM не нужен.
Sapienti sat!
Re[2]: Удивительная винда
От: Antikrot  
Дата: 10.07.10 14:22
Оценка:
Здравствуйте, McSeem2, Вы писали:

MS>Аааааа! Все гораздо хуже! Оно принципиально не хочет играть 96КГц сапмл-рейт!

MS>А это, на самом деле — потеря маркета, бездарная и тупая.
а объём этого маркета в деньгах не скажешь?
Re[3]: Удивительная винда
От: McSeem2 США http://www.antigrain.com
Дата: 10.07.10 15:57
Оценка:
Здравствуйте, Antikrot, Вы писали:

MS>>А это, на самом деле — потеря маркета, бездарная и тупая.

A>а объём этого маркета в деньгах не скажешь?

Легко. Надо посчитать количество ночных клубов по всему миру и умножить на 2 или 3 — столько диджеев нужно для его нормального функционирования. По-моему, вполне приличные деньги. А тут такое...
McSeem
Я жертва цепи несчастных случайностей. Как и все мы.
Re[10]: Удивительная винда
От: Vain Россия google.ru
Дата: 10.07.10 16:07
Оценка:
Здравствуйте, Cyberax, Вы писали:

C>Здравствуйте, CreatorCray, Вы писали:


C>>>В UTF-кодировках отсутствует endian. BOM позволяет лишь помечать файлы, как содержащие UTF, а посему смысла не имеет.

CC>>Драаааасте. BOM расшифровывается как Byte Order Mark.
C>Сорри, надо было уточнить — в UTF-8 нет endianness'а. В UTF-16/32 она есть, но тут речь в треде идёт об UTF-8.
А что, в UTF8 нет многобайтных символов?
[In theory there is no difference between theory and practice. In
practice there is.]
[Даю очевидные ответы на риторические вопросы]
Re[11]: Удивительная винда
От: Cyberax Марс  
Дата: 10.07.10 16:24
Оценка:
Здравствуйте, Vain, Вы писали:

C>>>>В UTF-кодировках отсутствует endian. BOM позволяет лишь помечать файлы, как содержащие UTF, а посему смысла не имеет.

CC>>>Драаааасте. BOM расшифровывается как Byte Order Mark.
C>>Сорри, надо было уточнить — в UTF-8 нет endianness'а. В UTF-16/32 она есть, но тут речь в треде идёт об UTF-8.
V>А что, в UTF8 нет многобайтных символов?
UTF-8 определена в терминах потока октетов. Так что вопросов с endianness'ом не возникает.

Вот UTF-16/32 определены в терминах 16- и 32-битных codepoint'ов. Отсюда и проблемы с порядком байт.
Sapienti sat!
Re[7]: Удивительная винда
От: Cyberax Марс  
Дата: 10.07.10 16:29
Оценка: -1
Здравствуйте, CreatorCray, Вы писали:

CC>Не надо фантазий. Он не обязателен, но UTF8 BOM не хотелка МС а пункт Unicode стандарта.

CC>http://unicode.org/faq/utf_bom.html#utf8-2
CC>

CC>Q: Is the UTF-8 encoding scheme the same irrespective of whether the underlying processor is little endian or big endian?
CC>A: Yes. Since UTF-8 is interpreted as a sequence of bytes, there is no endian problem as there is for encoding forms that use 16-bit or 32-bit code units. Where a BOM is used with UTF-8, it is only used as an ecoding signature to distinguish UTF-8 from other encodings — it has nothing to do with byte order

CC>Поэтому если программа не понимает UTF8 BOM — она не соответствует стандарту.
Во-первых, BOM опционален.

Во-вторых, стандарт в этом месте абсолютно идиотский. Скажем, непонятно как обрабатывать пустые файлы. Непонятно как быть с конкатенацией и т.п. Так что решение "не реализовывать BOM для UTF-8" — это абсолютно правильное поведение на практике.

Попытки оправдания глючного на практике поведения — это бессмысленный "standards lawyering".
Sapienti sat!
Re[4]: Удивительная винда
От: Antikrot  
Дата: 10.07.10 17:22
Оценка:
Здравствуйте, McSeem2, Вы писали:

MS>>>А это, на самом деле — потеря маркета, бездарная и тупая.

A>>а объём этого маркета в деньгах не скажешь?
MS>Легко. Надо посчитать количество ночных клубов по всему миру и умножить на 2 или 3 — столько диджеев нужно для его нормального функционирования.
даже если пересчитать линуксоидов, и то на порядки больше будет
Re[8]: Удивительная винда
От: CreatorCray  
Дата: 10.07.10 17:50
Оценка: +1
Здравствуйте, Cyberax, Вы писали:

CC>>Поэтому если программа не понимает UTF8 BOM — она не соответствует стандарту.

C>Во-первых, BOM опционален.
Опционален означает: может быть а может не быть.
Поэтому если прога не работает правильно если он всё таки есть то она стандарту не соответствует.

C>Во-вторых, стандарт в этом месте абсолютно идиотский. Скажем, непонятно как обрабатывать пустые файлы.

Никак. Он пустой.

C> Непонятно как быть с конкатенацией и т.п.

Читаем BOM, если он есть то конвертим входящий поток в тот вид, с которым объединяем. Если его нет — считаем что он в том же формате что и остальные данные.

C> Так что решение "не реализовывать BOM для UTF-8" — это абсолютно правильное поведение на практике.

Это халтура.
... << RSDN@Home 1.1.4 stable SR1 rev. 568>>
Забанили по IP, значит пора закрыть эту страницу.
Всем пока
Re[3]: Удивительная винда
От: Sharowarsheg  
Дата: 10.07.10 21:15
Оценка: :))
Здравствуйте, Mr.Cat, Вы писали:

MC>Здравствуйте, Don Reba, Вы писали:

DR>>Ну и MSPaint не поддерживает 16-битные каналы. Что-ж тут удивительного?
MC>Ну вот и зачем в поставке винды весь этот недософт? Если ms невыгодно поддерживать эти продукты — может, стоило просто упростить установку их бесплатных продвинутых аналогов (paint.net/gimp вместо mspaint, notepad++ вместо notepad и т.п.)?

Скорее всего, выгодно было бы включить MS Office прямо в винду, но тут же поднимется вой дикий, потому что начнет умирать Open Office. Всё остальное точно так же. Был бы развитый Paintbrush, начиная с Windows 3.0, не было бы сейчас в природе ни GIMP, ни Paint.NET.
Re[4]: Удивительная винда
От: Mr.Cat  
Дата: 10.07.10 21:27
Оценка: :)
Здравствуйте, Sharowarsheg, Вы писали:
S>Скорее всего, выгодно было бы включить MS Office прямо в винду ... Был бы развитый Paintbrush
Да какая разница, что было бы? Я про то, что сейчас безо всяких бы с виндой идет куча ненужного софта. От замены его на что-то более достойное винда бы только выиграла.
Re[8]: Удивительная винда
От: Mr.Cat  
Дата: 10.07.10 21:28
Оценка:
Здравствуйте, blackhearted, Вы писали:
B>Довольно критичны, особенно для совсем простых пользователей, которым даже скайп поставить нужно. Они-то как раз в нотепаде и пишут, и копируют туда.
Ну писали бы в нотепаде++ — он ничем не хуже и даже лучше.
Re[8]: Удивительная винда
От: Mr.Cat  
Дата: 10.07.10 21:31
Оценка:
Здравствуйте, March_rabbit, Вы писали:
M_>думаю, с тех самых, когда про винду стали судить по качеству этих компонентов
Да это ж какбы тенденция, что стандартный виндовый софт — полное дерьмо. Как было бы хорошо, если б в ОСи искаропки шел некий набор софта (KDE вот верной дорогой идет, хотя браузер у них до сих пор тот еще треш).
Re[9]: Удивительная винда
От: Cyberax Марс  
Дата: 10.07.10 21:35
Оценка: -1
Здравствуйте, CreatorCray, Вы писали:

C>>Во-вторых, стандарт в этом месте абсолютно идиотский. Скажем, непонятно как обрабатывать пустые файлы.

CC>Никак. Он пустой.
Нет. В нём BOM. А может и не BOM.

С точки зрения пользовательского уровня может оказаться, что пустые файлы — вовсе не пустые на диске.

C>> Непонятно как быть с конкатенацией и т.п.

CC>Читаем BOM, если он есть то конвертим входящий поток в тот вид, с которым объединяем. Если его нет — считаем что он в том же формате что и остальные данные.
Т.е. cat'ом объединить файлы уже нельзя. Нужно процессить BOM. А если это бинарный файл со случайно оказавшимся BOM'ом?

C>> Так что решение "не реализовывать BOM для UTF-8" — это абсолютно правильное поведение на практике.

CC>Это халтура.
Нет, это правильное решение.
Sapienti sat!
Re[12]: Удивительная винда
От: Mr.Cat  
Дата: 10.07.10 21:43
Оценка:
Здравствуйте, Cyberax, Вы писали:
C>Вот UTF-16/32 определены в терминах 16- и 32-битных codepoint'ов. Отсюда и проблемы с порядком байт.
Кстати, интересно а где-нибудь вообще оправдано хранение текста в utf-16/32? Вроде ведь все идет к тому, что utf-8 всех зарулит? Не?
Re[5]: Удивительная винда
От: Sharowarsheg  
Дата: 11.07.10 04:45
Оценка: +4 -2
Здравствуйте, Mr.Cat, Вы писали:

MC>Здравствуйте, Sharowarsheg, Вы писали:

S>>Скорее всего, выгодно было бы включить MS Office прямо в винду ... Был бы развитый Paintbrush
MC>Да какая разница, что было бы? Я про то, что сейчас безо всяких бы с виндой идет куча ненужного софта. От замены его на что-то более достойное винда бы только выиграла.

Антимонопольный комитет не разрешит. Даже на браузер и на тот бычат.
Re[4]: Удивительная винда
От: Nik_1 Россия  
Дата: 11.07.10 09:26
Оценка:
Здравствуйте, Константин Б., Вы писали:

КБ>Здравствуйте, Nik_1, Вы писали:


N_>>Здравствуйте, Константин Б., Вы писали:

КБ>>>А кто в здравом уме будет хранить музыку в некомпрессированных wav файлах?
N_>>А что, тормозплеервмплеер уже научился флак с апе поддерживать?

КБ>Объясните пожалуйста связь вашего вопроса с моим.

А ты обьясни смысл своего вопроса К чему ты это написал про вав?
А в чем же тогда "в здравом уме" потвоему хранят музыку, и чтоб этот формат поддерживал тормазплеер.
Re[5]: Удивительная винда
От: Константин Б. Россия  
Дата: 11.07.10 12:51
Оценка: -1
Здравствуйте, Nik_1, Вы писали:

N_>Здравствуйте, Константин Б., Вы писали:


КБ>>Здравствуйте, Nik_1, Вы писали:


N_>>>Здравствуйте, Константин Б., Вы писали:

КБ>>>>А кто в здравом уме будет хранить музыку в некомпрессированных wav файлах?
N_>>>А что, тормозплеервмплеер уже научился флак с апе поддерживать?

КБ>>Объясните пожалуйста связь вашего вопроса с моим.

N_>А ты обьясни смысл своего вопроса К чему ты это написал про вав?

Ну WMP — программа для проигрывания музыки. Проигрывать ей не музыку — глупо. Хранить музыку в некомпрессированном Wav — глупо вдвойне.

N_>А в чем же тогда "в здравом уме" потвоему хранят музыку, и чтоб этот формат поддерживал тормазплеер.


Из коробки или кодеки разрешено устанавливать? Ну вообще mp3 обычно.
Re[6]: Удивительная винда
От: Nik_1 Россия  
Дата: 11.07.10 14:38
Оценка: -2 :))
Здравствуйте, Константин Б., Вы писали:
КБ>Ну WMP — программа для проигрывания музыки. Проигрывать ей не музыку — глупо. Хранить музыку в некомпрессированном Wav — глупо вдвойне.
КБ>Из коробки или кодеки разрешено устанавливать? Ну вообще mp3 обычно.

Попробуй послушать музыку на нормальных колонках и тогда не будешь писать подобных глупостей.
Если на твоих пишалках раздници между мп3 и несжатым форматом неслышно, это не значит что ее нет на нормальных колонках
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.