Линус Торвальдс: ECC имеет значение
От: vsb Казахстан  
Дата: 03.01.21 18:30
Оценка: 7 (4) +4
https://www.realworldtech.com/forum/?threadid=198497&curpostid=198647

ECC absolutely matters.

ECC availability matters a lot — exactly because Intel has been instrumental in killing the whole ECC industry with it's horribly bad market segmentation.

Go out and search for ECC DIMMs — it's really hard to find. Yes — probably entirely thanks to AMD — it may have been gotten slightly better lately, but that's exactly my point.

Intel has been detrimental to the whole industry and to users because of their bad and misguided policies wrt ECC. Seriously.

And if you don't believe me, then just look at multiple generations of rowhammer, where each time Intel and memory manufacturers bleated about how it's going to be fixed next time.

Narrator: "No it wasn't".

And yes, that was — again — entirely about the misguided and arse-backwards policy of "consumers don't need ECC", which made the market for ECC memory go away.

The arguments against ECC were always complete and utter garbage. Now even the memory manufacturers are starting do do ECC internally because they finally owned up to the fact that they absolutely have to.

And the memory manufacturers claim it's because of economics and lower power. And they are lying bastards — let me once again point to row-hammer about how those problems have existed for several generations already, but these f*ckers happily sold broken hardware to consumers and claimed it was an "attack", when it always was "we're cutting corners".

How many times has a row-hammer like bit-flip happened just by pure bad luck on real non-attack loads? We will never know. Because Intel was pushing shit to consumers.

And I absolutely guarantee they happened. The "modern DRAM is so reliable that it doesn't need ECC" was always a bedtime story for children that had been dropped on their heads a bit too many times.

We have decades of odd random kernel oopses that could never be explained and were likely due to bad memory. And if it causes a kernel oops, I can guarantee that there are several orders of magnitude more cases where it just caused a bit-flip that just never ended up being so critical.

Yes, I'm pissed off about it. You can find me complaining about this literally for decades now. I don't want to say "I was right". I want this fixed, and I want ECC.

And AMD did it. Intel didn't.

> I don't really see AMD's unofficial ECC support being a big deal.


I disagree. The difference between "the market for working memory actually exists" and "screw consumers over by selling them subtly unreliable hardware" is an absolutely enormous one.

And the fact that it's "unofficial" for AMD doesn't matter. It works. And it allows the markets to — admittedly probably very slowly — start fixing themselves.

But I blame Intel, because they were the big fish in the pond, and they were the ones that caused the ECC market to basically implode over a couple of decades.

ECC DRAM (or just parity) used to be standard and easily accessible back when. ECC and parity isn't a new thing. It was literally killed by bad Intel policies.

And don't let people tell you that DRAM got so reliable that it wasn't needed. That was never ever really true. See above.

  Машинный перевод
ECC абсолютно имеет значение.

Доступность ECC имеет большое значение — именно потому, что Intel сыграл важную роль в убийстве всей индустрии ECC с ее ужасно плохой сегментацией рынка.

Выходите и ищите ECC DIMM — это действительно трудно найти. Да — возможно, полностью благодаря AMD — возможно, в последнее время он стал немного лучше, но это именно моя точка зрения.

Intel наносит вред всей индустрии и пользователям из-за их плохой и ошибочной политики в отношении ECC. Серьезно.

И если вы мне не верите, то просто посмотрите на несколько поколений rowhammer, в которых каждый раз Intel и производители памяти морочили голову о том, как это будет исправлено в следующий раз.

Подсказка: "Нет, не было".

И да, это было — опять же — полностью по поводу ошибочной и заднепроходной политики "потребителям не нужен ECC", которая заставила рынок памяти ECC уйти.

Аргументы против ECC всегда были полными и полными отбросами. Теперь даже производители памяти начинают делать ECC внутри себя, потому что в конце концов поняли, что они абсолютно обязаны это делать.

И производители памяти утверждают, что это из-за экономики и меньшей мощности. И они лживые ублюдки — позвольте мне еще раз указать на row-hammer о том, как эти проблемы существовали уже несколько поколений, но эти f*ckers счастливо продавали сломанную аппаратуру потребителям и утверждали, что это была "атака", когда это всегда было "мы срезаем углы".

Сколько раз рядовой row-hammer, как бит-флип, случался просто по чистой невезении на реальных ненападающих нагрузках? Мы никогда не узнаем. Потому что Intel толкал дерьмо к потребителям.

И я абсолютно гарантирую, что это случалось. "Современная DRAM настолько надежна, что ей не нужен ECC" всегда была сказкой на ночь для детей, которые слишком часто падали на голову.

У нас есть десятилетия странных случайных oops из ядра, которые никогда не могли быть объяснены и, скорее всего, были вызваны плохой памятью. И если это вызывает oops ядра, я могу гарантировать, что есть на несколько порядков больше случаев, когда это просто вызвало бит-флип, который просто никогда не заканчивался так критично.

Да, я злюсь из-за этого. Вы можете обнаружить, что я жалуюсь на это буквально десятилетиями. Я не хочу говорить "Я был прав". Я хочу, чтобы это было исправлено, и я хочу ECC.

И AMD сделал это. Интел не делал этого.

> Я не вижу, чтобы неофициальная поддержка AMD была чем-то важным.


Я не согласен. Разница между "рынком рабочей памяти на самом деле существует" и "подставить потребителей, продавая им слегка ненадежное оборудование" абсолютно огромна.

И тот факт, что это "неофициально" для AMD не имеет значения. Это работает. И это позволяет рынкам — по правде говоря, наверное, очень медленно — начать исправляться.

Но я виню Intel, потому что именно они были большой рыбой в пруду, и именно они привели к тому, что рынок ECC в основном взорвался за пару десятилетий.

Раньше ECC DRAM (или просто parity) были стандартными и легкодоступными. ECC и parity не являются чем-то новым. Его буквально убила плохая политика Intel.

И не позволяйте людям говорить вам, что DRAM стал настолько надежным, что в нем не было необходимости. Это никогда не было правдой. Смотрите выше.


Переведено с помощью www.DeepL.com/Translator (бесплатная версия)
Отредактировано 03.01.2021 18:37 vsb . Предыдущая версия .
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.