Интел снова снизил производительность задним числом
От: Тёмчик Австралия жж
Дата: 03.01.22 04:24
Оценка: 2 (2)
https://www.igorslab.de/en/intel-deactivated-avx-512-on-alder-lake-but-fully-questionable-interpretation-of-efficiency-news-editorial/

Обладатели Alder Lake 12900 могут попрощаться с AVX512. Запрет прилетит с обновлением микрокода.
Re: Интел снова снизил производительность задним числом
От: Эйнсток Файр Мухосранск Странный реагент
Дата: 03.01.22 06:11
Оценка: :)
Тё> Обладатели Alder Lake 12900 могут попрощаться с AVX512. Запрет прилетит с обновлением микрокода.

Как же хорошо, что я не успел его купить.
Re: Интел снова снизил производительность задним числом
От: Nuzhny Россия https://github.com/Nuzhny007
Дата: 03.01.22 06:25
Оценка: +1
Здравствуйте, Тёмчик, Вы писали:

Тё>Обладатели Alder Lake 12900 могут попрощаться с AVX512. Запрет прилетит с обновлением микрокода.


Чисто из интереса: а AVX512 реально где-то используется? И второе: я слышал рассказы, что при использовании сильно падает частота, поэтому толка не так много.
Re: Интел снова снизил производительность задним числом
От: netch80 Украина http://netch80.dreamwidth.org/
Дата: 03.01.22 07:54
Оценка: 1 (1) +1
Здравствуйте, Тёмчик, Вы писали:

Тё>https://www.igorslab.de/en/intel-deactivated-avx-512-on-alder-lake-but-fully-questionable-interpretation-of-efficiency-news-editorial/


Тё>Обладатели Alder Lake 12900 могут попрощаться с AVX512. Запрет прилетит с обновлением микрокода.


"На хвосте висит мочало. Не начать ли всё сначала?"

Может кто-то с фактами объяснить, чем именно AVX-512 так плох (греет процессор?), что вызывает эффекты типа снижения частоты или полный запрет?
Что в нём такого, что у каждого ядра есть 4-5 обычных АЛУ, которые могут работать впараллель, а уже 8 (чтобы работали команды 8*64) оно не тянет? Чем операции в AVX512 такие дорогие?
Почему тротлинг начинается аж от AVX2 (256 бит)?
The God is real, unless declared integer.
Re[2]: Интел снова снизил производительность задним числом
От: Shtole  
Дата: 03.01.22 11:38
Оценка:
Здравствуйте, Nuzhny, Вы писали:

N>Чисто из интереса: а AVX512 реально где-то используется?


Я так понял, главным образом для нейросетевой ерунды функциональности.

>И второе: я слышал рассказы, что при использовании сильно падает частота, поэтому толка не так много.


Пишут, что искусственное снижение частоты при использовании AVX512, как и блокировку AVX512 вообще, можно обойти, если это позволяет материнская плата и некоторые ASUS'ы позволяют.
Do you want to develop an app?
Отредактировано 03.01.2022 12:49 Shtole . Предыдущая версия .
Re[2]: Интел снова снизил производительность задним числом
От: vsb Казахстан  
Дата: 03.01.22 12:15
Оценка: 1 (1)
Здравствуйте, Nuzhny, Вы писали:

Тё>>Обладатели Alder Lake 12900 могут попрощаться с AVX512. Запрет прилетит с обновлением микрокода.


N>Чисто из интереса: а AVX512 реально где-то используется?


H.265 может использовать, например.

> И второе: я слышал рассказы, что при использовании сильно падает частота, поэтому толка не так много.


От всего может падать частота. Толк в любом случае есть, даже со сниженной частотой данные обрабатываются гораздо быстрей, чем без AVX-512.

Но в целом то, что эти инструкции толком нигде не доступны, конечно сильно мешают их повсеместному использованию.
Re[2]: Интел снова снизил производительность задним числом
От: Alexander G Украина  
Дата: 03.01.22 12:45
Оценка:
Здравствуйте, Nuzhny, Вы писали:


N>Чисто из интереса: а AVX512 реально где-то используется?


Да в принципе где угодно может. Это в основном дальнейшее развитие SSE/AVX, та же векторизация, только снова в два раза длиннее.
Чтобы убедиться, можно собрать не хелло ворлд C/C++ приложение с /arch:AVX512 если MSVC, -mavx512f -mavx512cd -mavx512vl -mavx512bw -mavx512dq, если gcc/clang и увидеть креш с Undefined Instruction на не-AVX512 процессоре.
Русский военный корабль идёт ко дну!
Re[3]: Интел снова снизил производительность задним числом
От: Nuzhny Россия https://github.com/Nuzhny007
Дата: 03.01.22 13:55
Оценка:
Здравствуйте, Shtole, Вы писали:

N>>Чисто из интереса: а AVX512 реально где-то используется?

S>Я так понял, главным образом для нейросетевой ерунды функциональности.

С одной стороны, да. Я видел статью от Майкрософта, где оно давало буст, но не само по себе, а включая очень сложную системы кэшировани промежуточных результатов. Ведь при инференсе нейросетей не процессор узкое место, а необходимость бесконечного многократного копирования весов нейросети из ОЗУ в кэш (не считая входных данных). Так себе применение, если честно.
Re[3]: Интел снова снизил производительность задним числом
От: Nuzhny Россия https://github.com/Nuzhny007
Дата: 03.01.22 13:56
Оценка:
Здравствуйте, Alexander G, Вы писали:

AG>Да в принципе где угодно может. Это в основном дальнейшее развитие SSE/AVX, та же векторизация, только снова в два раза длиннее.

AG>Чтобы убедиться, можно собрать не хелло ворлд C/C++ приложение с /arch:AVX512 если MSVC, -mavx512f -mavx512cd -mavx512vl -mavx512bw -mavx512dq, если gcc/clang и увидеть креш с Undefined Instruction на не-AVX512 процессоре.

Это понятно, что потенциально многие могут использовать. Но кто использует притом с пользой для себя? Кодеки — это хороший пример, если нет аппаратной поддержки, конечно.
Re[2]: Интел снова снизил производительность задним числом
От: Тёмчик Австралия жж
Дата: 03.01.22 14:03
Оценка:
Здравствуйте, Nuzhny, Вы писали:

N>Чисто из интереса: а AVX512 реально где-то используется? И второе: я слышал рассказы, что при использовании сильно падает частота, поэтому толка не так много.


В кодеках может быть полезно. По статье, у меня возникла такая теория: наличие AVX512 в полноценных ядрах, и отсуствие в e-waste ядрах, вносит путаницу. При активных e-ядрах, AVX512 невозможен. Поэтому, алдеры совсем без e-ядер могут, в теории, cannibalise их i9 просто за счет AVX512. Вот AVX512 и отключили.
Возможно, что в следующем поколении, завезут AVX512 в e-ядра, либо заменят их на полноценные и снова активируют. Пространство для маневра, на случай если AMD выкатит быстрее проц.

Вот что интересно: эта победа 12900 в некоторых сценариях, там AVX512 использовался?
Re[2]: Интел снова снизил производительность задним числом
От: Cyberax Марс  
Дата: 03.01.22 14:57
Оценка: 4 (3)
Здравствуйте, Nuzhny, Вы писали:

Тё>>Обладатели Alder Lake 12900 могут попрощаться с AVX512. Запрет прилетит с обновлением микрокода.

N>Чисто из интереса: а AVX512 реально где-то используется? И второе: я слышал рассказы, что при использовании сильно падает частота, поэтому толка не так много.
Используем для трассировщика лучей. С помощью AVX код проверяет 16 треугольников подряд, так что ускорение получается очень неплохое.
Sapienti sat!
Re[2]: Интел снова снизил производительность задним числом
От: Cyberax Марс  
Дата: 03.01.22 15:03
Оценка:
Здравствуйте, netch80, Вы писали:

Тё>>Обладатели Alder Lake 12900 могут попрощаться с AVX512. Запрет прилетит с обновлением микрокода.

N>"На хвосте висит мочало. Не начать ли всё сначала?"
N>Может кто-то с фактами объяснить, чем именно AVX-512 так плох (греет процессор?), что вызывает эффекты типа снижения частоты или полный запрет?
Проблема в том, что при обычной работе узлы AVX-512 на процессоре отключены и энергию не потребляют. И при их включении их тепловой бюджет начинает съедать бюджет нормальных ALU. Причём так кардинально начинает.

Выглядит это так — запускаем функцию, которая использует AVX, и весь остальной код начинает тормозить.
Sapienti sat!
Re[3]: Интел снова снизил производительность задним числом
От: xma  
Дата: 03.01.22 15:05
Оценка: +1
Здравствуйте, Cyberax, Вы писали:

C>Используем для трассировщика лучей. С помощью AVX код проверяет 16 треугольников подряд, так что ускорение получается очень неплохое.


а чё за продукт (если не секрет) и почему не на RTX картах ? (с аппаратной трассировкой лучей)
Re[3]: Интел снова снизил производительность задним числом
От: netch80 Украина http://netch80.dreamwidth.org/
Дата: 03.01.22 15:21
Оценка:
Здравствуйте, Cyberax, Вы писали:

N>>Может кто-то с фактами объяснить, чем именно AVX-512 так плох (греет процессор?), что вызывает эффекты типа снижения частоты или полный запрет?

C>Проблема в том, что при обычной работе узлы AVX-512 на процессоре отключены и энергию не потребляют. И при их включении их тепловой бюджет начинает съедать бюджет нормальных ALU. Причём так кардинально начинает.

То есть узлы AVX-512 это нечто отдельное от узлов AVX-256 и от узлов AVX/SSE-128, и ещё и от FPU, с которыми они могли объединить пачку функций типа сложения single и double? А почему так? Зачем выделять какие-то отдельные узлы под это? Почему не так, что в зависимости от длины операндов просто активируется разное количество одинаковых узлов?

Или имеется в виду, что, например, 2 узла (под 128 бит) входят в расчётный бюджет, а 4 или 8 (под 512) уже не входят? Если да, то почему они не включены в бюджет процессоров уровня i9/Xeon, если те и так имеют сильно расширенный бюджет?

Без ответов на эти вопросы предыдущий ответ выглядит принципиально неполным.

C>Выглядит это так — запускаем функцию, которая использует AVX, и весь остальной код начинает тормозить.


Да, я такое слышал и про AVX-256. Но продолжаю не понимать.
The God is real, unless declared integer.
Re: Интел снова снизил производительность задним числом
От: Nuzhny Россия https://github.com/Nuzhny007
Дата: 03.01.22 15:26
Оценка: 3 (3) :)
Здравствуйте, Тёмчик, Вы писали:

Тё>Обладатели Alder Lake 12900 могут попрощаться с AVX512. Запрет прилетит с обновлением микрокода.


Вспомнил мнение Торвальдса по этому поводу:

I Hope AVX512 Dies A Painful Death

Re[2]: Интел снова снизил производительность задним числом
От: Michael7 Россия  
Дата: 03.01.22 17:33
Оценка:
Здравствуйте, Nuzhny, Вы писали:

N>Чисто из интереса: а AVX512 реально где-то используется?


Например, в продукции Topaz Gigapixel -это разные нейросетевые обработчики фото и видео: чистка от шумов, интеллектуальное увеличение и др. Вроде (сам не проверял) включение AVX512 дает примерно двукратное ускорение.

В свою очередь интересно, это только AlderLake 12900 касается? Или только у него и был AVX512?
Re[4]: Интел снова снизил производительность задним числом
От: Cyberax Марс  
Дата: 03.01.22 20:37
Оценка:
Здравствуйте, xma, Вы писали:

C>>Используем для трассировщика лучей. С помощью AVX код проверяет 16 треугольников подряд, так что ускорение получается очень неплохое.

xma>а чё за продукт (если не секрет) и почему не на RTX картах ? (с аппаратной трассировкой лучей)
https://www.aurorasolar.com/

Используем CPU просто банально из-за того, что дешевле. Трассировка лучей — это только часть необходимой работы. Кроме того, у нас немного упрощённая задача — мы просто проверяем на пересечение лучей и геометрии сцены, нам не нужно проверять отражения.

Кстати, RTX тестировали, он быстрее примерно в 100 раз.
Sapienti sat!
Re[4]: Интел снова снизил производительность задним числом
От: Cyberax Марс  
Дата: 03.01.22 20:48
Оценка:
Здравствуйте, netch80, Вы писали:

C>>Проблема в том, что при обычной работе узлы AVX-512 на процессоре отключены и энергию не потребляют. И при их включении их тепловой бюджет начинает съедать бюджет нормальных ALU. Причём так кардинально начинает.

N>То есть узлы AVX-512 это нечто отдельное от узлов AVX-256 и от узлов AVX/SSE-128, и ещё и от FPU, с которыми они могли объединить пачку функций типа сложения single и double?
Я не очень понимаю как оно устроено, но похоже что именно так.

Эффект вполне реальный и хорошо документированный: https://blog.cloudflare.com/on-the-dangers-of-intels-frequency-scaling/

N>А почему так? Зачем выделять какие-то отдельные узлы под это? Почему не так, что в зависимости от длины операндов просто активируется разное количество одинаковых узлов?

Думаю, что результат эволюционной доработки. Добавлять поддержку 512-битных векторов в обычные ALU они ниасилили, и просто приделали дополнительные модули сбоку (когда появился свободный бюджет транзисторов).

N>Или имеется в виду, что, например, 2 узла (под 128 бит) входят в расчётный бюджет, а 4 или 8 (под 512) уже не входят? Если да, то почему они не включены в бюджет процессоров уровня i9/Xeon, если те и так имеют сильно расширенный бюджет?

Насколько я понимаю, AVX-512 действительно реализован совсем отдельным блоком.

C>>Выглядит это так — запускаем функцию, которая использует AVX, и весь остальной код начинает тормозить.

N>Да, я такое слышал и про AVX-256. Но продолжаю не понимать.
С AVX-256 мы такого не видели.
Sapienti sat!
Re[2]: Интел снова снизил производительность задним числом
От: CreatorCray  
Дата: 03.01.22 22:34
Оценка: +3 -3 :)
Здравствуйте, Nuzhny, Вы писали:

N>Вспомнил мнение Торвальдса по этому поводу:

N>

N>I Hope AVX512 Dies A Painful Death



А у пингвина всё подгорает. То от Nvidia, то от Apple M1, то от Intel
Никак не смирится что остальному миру срать на его хотелки.
... << RSDN@Home 1.3.110 alpha 5 rev. 62>>
Забанили по IP, значит пора закрыть эту страницу.
Всем пока
Re[5]: Интел снова снизил производительность задним числом
От: Тёмчик Австралия жж
Дата: 04.01.22 02:08
Оценка:
Здравствуйте, Cyberax, Вы писали:

C>>>Выглядит это так — запускаем функцию, которая использует AVX, и весь остальной код начинает тормозить.

N>>Да, я такое слышал и про AVX-256. Но продолжаю не понимать.
C>С AVX-256 мы такого не видели.

C AVX2 тоже активируется потолок по частоте 5.1ггц (могу ошибаться). Так что, если намеряли попугаев сначала без AVX2, но под 5.2ггц, а потом под AVX2- это разные попугаи. Вообще, сладывается такое подозрение, что рекламные обзоры "рекомендуем к покупке" с портянками попугаев под разными синтетическими тестами, и с попугаями древних, как кал мамонта, игр в FHD (а раньше было и в 1280x720) — вводящая в заблуждение реклама.
В любом случае, люди повелись на этих попугаев, которых им в реальном использовании не видать, а потом их кинули. Задним числом. Интел делает это снова и снова. В такой ситуации набросы на AMD "он медленнее на 10% в рекламной статье" несостоятельны по причине, что результаты в статье в любой момент могут стухнуть.
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.