Здравствуйте, Тёмчик, Вы писали:
Тё>Обладатели Alder Lake 12900 могут попрощаться с AVX512. Запрет прилетит с обновлением микрокода.
Чисто из интереса: а AVX512 реально где-то используется? И второе: я слышал рассказы, что при использовании сильно падает частота, поэтому толка не так много.
Re: Интел снова снизил производительность задним числом
"На хвосте висит мочало. Не начать ли всё сначала?"
Может кто-то с фактами объяснить, чем именно AVX-512 так плох (греет процессор?), что вызывает эффекты типа снижения частоты или полный запрет?
Что в нём такого, что у каждого ядра есть 4-5 обычных АЛУ, которые могут работать впараллель, а уже 8 (чтобы работали команды 8*64) оно не тянет? Чем операции в AVX512 такие дорогие?
Почему тротлинг начинается аж от AVX2 (256 бит)?
The God is real, unless declared integer.
Re[2]: Интел снова снизил производительность задним числом
Здравствуйте, Nuzhny, Вы писали:
N>Чисто из интереса: а AVX512 реально где-то используется?
Я так понял, главным образом для нейросетевой ерунды функциональности.
>И второе: я слышал рассказы, что при использовании сильно падает частота, поэтому толка не так много.
Пишут, что искусственное снижение частоты при использовании AVX512, как и блокировку AVX512 вообще, можно обойти, если это позволяет материнская плата и некоторые ASUS'ы позволяют.
Здравствуйте, Nuzhny, Вы писали:
Тё>>Обладатели Alder Lake 12900 могут попрощаться с AVX512. Запрет прилетит с обновлением микрокода.
N>Чисто из интереса: а AVX512 реально где-то используется?
H.265 может использовать, например.
> И второе: я слышал рассказы, что при использовании сильно падает частота, поэтому толка не так много.
От всего может падать частота. Толк в любом случае есть, даже со сниженной частотой данные обрабатываются гораздо быстрей, чем без AVX-512.
Но в целом то, что эти инструкции толком нигде не доступны, конечно сильно мешают их повсеместному использованию.
Re[2]: Интел снова снизил производительность задним числом
N>Чисто из интереса: а AVX512 реально где-то используется?
Да в принципе где угодно может. Это в основном дальнейшее развитие SSE/AVX, та же векторизация, только снова в два раза длиннее.
Чтобы убедиться, можно собрать не хелло ворлд C/C++ приложение с /arch:AVX512 если MSVC, -mavx512f -mavx512cd -mavx512vl -mavx512bw -mavx512dq, если gcc/clang и увидеть креш с Undefined Instruction на не-AVX512 процессоре.
Русский военный корабль идёт ко дну!
Re[3]: Интел снова снизил производительность задним числом
Здравствуйте, Shtole, Вы писали:
N>>Чисто из интереса: а AVX512 реально где-то используется? S>Я так понял, главным образом для нейросетевой ерунды функциональности.
С одной стороны, да. Я видел статью от Майкрософта, где оно давало буст, но не само по себе, а включая очень сложную системы кэшировани промежуточных результатов. Ведь при инференсе нейросетей не процессор узкое место, а необходимость бесконечного многократного копирования весов нейросети из ОЗУ в кэш (не считая входных данных). Так себе применение, если честно.
Re[3]: Интел снова снизил производительность задним числом
Здравствуйте, Alexander G, Вы писали:
AG>Да в принципе где угодно может. Это в основном дальнейшее развитие SSE/AVX, та же векторизация, только снова в два раза длиннее. AG>Чтобы убедиться, можно собрать не хелло ворлд C/C++ приложение с /arch:AVX512 если MSVC, -mavx512f -mavx512cd -mavx512vl -mavx512bw -mavx512dq, если gcc/clang и увидеть креш с Undefined Instruction на не-AVX512 процессоре.
Это понятно, что потенциально многие могут использовать. Но кто использует притом с пользой для себя? Кодеки — это хороший пример, если нет аппаратной поддержки, конечно.
Re[2]: Интел снова снизил производительность задним числом
Здравствуйте, Nuzhny, Вы писали:
N>Чисто из интереса: а AVX512 реально где-то используется? И второе: я слышал рассказы, что при использовании сильно падает частота, поэтому толка не так много.
В кодеках может быть полезно. По статье, у меня возникла такая теория: наличие AVX512 в полноценных ядрах, и отсуствие в e-waste ядрах, вносит путаницу. При активных e-ядрах, AVX512 невозможен. Поэтому, алдеры совсем без e-ядер могут, в теории, cannibalise их i9 просто за счет AVX512. Вот AVX512 и отключили.
Возможно, что в следующем поколении, завезут AVX512 в e-ядра, либо заменят их на полноценные и снова активируют. Пространство для маневра, на случай если AMD выкатит быстрее проц.
Вот что интересно: эта победа 12900 в некоторых сценариях, там AVX512 использовался?
Re[2]: Интел снова снизил производительность задним числом
Здравствуйте, Nuzhny, Вы писали:
Тё>>Обладатели Alder Lake 12900 могут попрощаться с AVX512. Запрет прилетит с обновлением микрокода. N>Чисто из интереса: а AVX512 реально где-то используется? И второе: я слышал рассказы, что при использовании сильно падает частота, поэтому толка не так много.
Используем для трассировщика лучей. С помощью AVX код проверяет 16 треугольников подряд, так что ускорение получается очень неплохое.
Sapienti sat!
Re[2]: Интел снова снизил производительность задним числом
Здравствуйте, netch80, Вы писали:
Тё>>Обладатели Alder Lake 12900 могут попрощаться с AVX512. Запрет прилетит с обновлением микрокода. N>"На хвосте висит мочало. Не начать ли всё сначала?" N>Может кто-то с фактами объяснить, чем именно AVX-512 так плох (греет процессор?), что вызывает эффекты типа снижения частоты или полный запрет?
Проблема в том, что при обычной работе узлы AVX-512 на процессоре отключены и энергию не потребляют. И при их включении их тепловой бюджет начинает съедать бюджет нормальных ALU. Причём так кардинально начинает.
Выглядит это так — запускаем функцию, которая использует AVX, и весь остальной код начинает тормозить.
Sapienti sat!
Re[3]: Интел снова снизил производительность задним числом
Здравствуйте, Cyberax, Вы писали:
C>Используем для трассировщика лучей. С помощью AVX код проверяет 16 треугольников подряд, так что ускорение получается очень неплохое.
а чё за продукт (если не секрет) и почему не на RTX картах ? (с аппаратной трассировкой лучей)
Re[3]: Интел снова снизил производительность задним числом
Здравствуйте, Cyberax, Вы писали:
N>>Может кто-то с фактами объяснить, чем именно AVX-512 так плох (греет процессор?), что вызывает эффекты типа снижения частоты или полный запрет? C>Проблема в том, что при обычной работе узлы AVX-512 на процессоре отключены и энергию не потребляют. И при их включении их тепловой бюджет начинает съедать бюджет нормальных ALU. Причём так кардинально начинает.
То есть узлы AVX-512 это нечто отдельное от узлов AVX-256 и от узлов AVX/SSE-128, и ещё и от FPU, с которыми они могли объединить пачку функций типа сложения single и double? А почему так? Зачем выделять какие-то отдельные узлы под это? Почему не так, что в зависимости от длины операндов просто активируется разное количество одинаковых узлов?
Или имеется в виду, что, например, 2 узла (под 128 бит) входят в расчётный бюджет, а 4 или 8 (под 512) уже не входят? Если да, то почему они не включены в бюджет процессоров уровня i9/Xeon, если те и так имеют сильно расширенный бюджет?
Без ответов на эти вопросы предыдущий ответ выглядит принципиально неполным.
C>Выглядит это так — запускаем функцию, которая использует AVX, и весь остальной код начинает тормозить.
Да, я такое слышал и про AVX-256. Но продолжаю не понимать.
The God is real, unless declared integer.
Re: Интел снова снизил производительность задним числом
Здравствуйте, Nuzhny, Вы писали:
N>Чисто из интереса: а AVX512 реально где-то используется?
Например, в продукции Topaz Gigapixel -это разные нейросетевые обработчики фото и видео: чистка от шумов, интеллектуальное увеличение и др. Вроде (сам не проверял) включение AVX512 дает примерно двукратное ускорение.
В свою очередь интересно, это только AlderLake 12900 касается? Или только у него и был AVX512?
Re[4]: Интел снова снизил производительность задним числом
Здравствуйте, xma, Вы писали:
C>>Используем для трассировщика лучей. С помощью AVX код проверяет 16 треугольников подряд, так что ускорение получается очень неплохое. xma>а чё за продукт (если не секрет) и почему не на RTX картах ? (с аппаратной трассировкой лучей) https://www.aurorasolar.com/
Используем CPU просто банально из-за того, что дешевле. Трассировка лучей — это только часть необходимой работы. Кроме того, у нас немного упрощённая задача — мы просто проверяем на пересечение лучей и геометрии сцены, нам не нужно проверять отражения.
Кстати, RTX тестировали, он быстрее примерно в 100 раз.
Sapienti sat!
Re[4]: Интел снова снизил производительность задним числом
Здравствуйте, netch80, Вы писали:
C>>Проблема в том, что при обычной работе узлы AVX-512 на процессоре отключены и энергию не потребляют. И при их включении их тепловой бюджет начинает съедать бюджет нормальных ALU. Причём так кардинально начинает. N>То есть узлы AVX-512 это нечто отдельное от узлов AVX-256 и от узлов AVX/SSE-128, и ещё и от FPU, с которыми они могли объединить пачку функций типа сложения single и double?
Я не очень понимаю как оно устроено, но похоже что именно так.
Эффект вполне реальный и хорошо документированный: https://blog.cloudflare.com/on-the-dangers-of-intels-frequency-scaling/
N>А почему так? Зачем выделять какие-то отдельные узлы под это? Почему не так, что в зависимости от длины операндов просто активируется разное количество одинаковых узлов?
Думаю, что результат эволюционной доработки. Добавлять поддержку 512-битных векторов в обычные ALU они ниасилили, и просто приделали дополнительные модули сбоку (когда появился свободный бюджет транзисторов).
N>Или имеется в виду, что, например, 2 узла (под 128 бит) входят в расчётный бюджет, а 4 или 8 (под 512) уже не входят? Если да, то почему они не включены в бюджет процессоров уровня i9/Xeon, если те и так имеют сильно расширенный бюджет?
Насколько я понимаю, AVX-512 действительно реализован совсем отдельным блоком.
C>>Выглядит это так — запускаем функцию, которая использует AVX, и весь остальной код начинает тормозить. N>Да, я такое слышал и про AVX-256. Но продолжаю не понимать.
С AVX-256 мы такого не видели.
Sapienti sat!
Re[2]: Интел снова снизил производительность задним числом
Здравствуйте, Cyberax, Вы писали:
C>>>Выглядит это так — запускаем функцию, которая использует AVX, и весь остальной код начинает тормозить. N>>Да, я такое слышал и про AVX-256. Но продолжаю не понимать. C>С AVX-256 мы такого не видели.
C AVX2 тоже активируется потолок по частоте 5.1ггц (могу ошибаться). Так что, если намеряли попугаев сначала без AVX2, но под 5.2ггц, а потом под AVX2- это разные попугаи. Вообще, сладывается такое подозрение, что рекламные обзоры "рекомендуем к покупке" с портянками попугаев под разными синтетическими тестами, и с попугаями древних, как кал мамонта, игр в FHD (а раньше было и в 1280x720) — вводящая в заблуждение реклама.
В любом случае, люди повелись на этих попугаев, которых им в реальном использовании не видать, а потом их кинули. Задним числом. Интел делает это снова и снова. В такой ситуации набросы на AMD "он медленнее на 10% в рекламной статье" несостоятельны по причине, что результаты в статье в любой момент могут стухнуть.