Сообщение Re[22]: .Net на эльбрусах от 17.08.2022 14:03
Изменено 17.08.2022 14:19 vdimas
V>>На самом деле верно, средняя производительность на ядро при той же частоте как раз выросла примерно на 60%, при этом часть добавочной производительности вовсе не заслуга ядра, а обновлённого IO, в т.ч. общения с RAM.
4>Если так рассматривать, то по сути до сих пор ничего не изменилось с момента появления Sandy Bridge.
Та да, тогда добавили кеш инструкций 0-го уровня.
С тех пор в поколениях изменения навроде таких:
Improvements
— Larger L2 caches (1.25 MB per core from 512 KB per core)
— Larger L3 caches (3 MB per core from 2 MB per core)
— A new AVX-512 instruction: Vector Pair Intersection to a Pair of Mask Registers, VP2INTERSECT[5][6]
— Control Flow Enforcement Technology to prevent return-oriented programming and jump-oriented programming exploitation techniques[7]
— Full memory (RAM) encryption[8]
— Indirect branch tracking and shadow stack
— Intel Key Locker[9][10]
— AVX/AVX2 instructions support for Pentium Gold and Celeron processors has been unlocked[6]
Заметных именно архитектурных изменений с 2012-го не было, с тех пор мы наблюдаем смерть десктопной x86/x64-архитектуры.
В последнем поколении они вообще оборзели — за новизну выдали сочетание жирных и тонких ядер на одном кристалле, нагло поменяв номер поколения, не изменив в другом вообще ничего.
Это уже всё, финита ля комедия.
V>>Предел развития суперскаляров был виден самой же Intel еще в конце 90-х, когда они разрабатывали 4-й пень, который работал на многих задачах хуже 3-го пня в пересчёте на частоту на ядро. Отсюда Itanium, который был похерен AMD через продление агонии x86-й архитектуры. ))
4>Убогоархитектурный P4 позволял по быстрому прощупать пределы тактовых частот, которые потом долгое время придётся использовать.
Мда... ))
P4 — это гипертрединг, это было серьезное отличие от предыдущих поколений.
Ничего убогого в этом нет, это был способ повысить эффективность использования ресурсов и это работает.
Правда, два потока на ядро ни о чём, некоторые процы-современники тогда показывали 4-8 потоков на ядро, ну да ладно...
В общем, все последующие пни — по-сути эволюционное развитие именно того самого первого варианта 4-го пня (не берём линейку Atom).
Наибольшее кол-во изменений в архитектуре было сделано уже к 2004-му году, с тех пор гонка пней вошла в насыщение, а в 2012-м умерла окончательно.
Но это по-прежнему тот самый 4-й пень, прошу любить и жаловать.
4>IA-64 уступал по производительности AMD64, поэтому смысла в его существовании дальше не было.
Дудки, на момент выхода не уступал, а на многих задачах (на мультимедии, ИИ, шифровании и т.д.) — заметно превосходил.
Уступать стал позже, когда на него забили, по причине примерно нулевых продаж.
V>>Потому что x86 и ARM-ы могут в любой момент быть закрыты западными санкциями и мы можем остаться без процов.
4>Ничего особо не мешает штамповать клоны x86 и ARM по устаревшим ТП на маленьких заводиках в Китае
Устаревшие не нужны.
У нас MIPS и SPARC на уровне, они кратно лучше устаревших тех.
4>да и наличие т.н. "параллельного импорта" исключает возможность совсем остаться без процов, поставки только сократятся, и ценник будет выше, но всё-равно это дешевле, чем делать свою архитектуру и так-же её производить на маленьких заводиках в Китае.
На маленьких заводиках, говоришь? ))
V>>Поэтому и продолжают у нас развивать MIPS, SPARC и Эльбрус.
V>>Первый для контроллеров, второй для чего-то некритичного к вычислениям, последний — серьёзная числомолотилка.
4>
4>... первоначально инженеры из IBM пытались при создании SPE следовать канонам VLIW, однако столкнулись с серьезными проблемами и вернулись к уже хорошо обкатанной архитектуре SIMD-сопроцессора Altivec/VMX.
Да всем похрен, что конкретно IBM ниасилили.
IBM никогда не отличалась в эффективных вычислениях, всю свою историю она клепала машинки "для бизнеса".
С бюджетом в десятки раз меньшем когда-то Cray их нагнул как маленьких детей в нише числодробилок.
Мне было бы стыдно...
4>Так вот, почти весь жизненный цикл этих консолей (7 лет) разработчики под PS3 пытались раскрыть тот самый потенциал SPE, но удавалось это только в единичных случаях (и при активном участии со стороны Sony/IBM), а основной ширпотреб (кроссплатформа) была в пользу XBox 360, в основном за счёт сложностей связанных с использованием SPE.
Потому что гибридный код для двух архитектур одновременно — это хуже гири на ногах.
Представь, у тебя на обычном С++ только main, а потом на покалеченном языке, навроде самых первых версий языков для шейдеров, ты пишешь остальную программу?
Причём, со всеми прелестями шейдеров, когда у тебя нет доступа к объектам/данным из обычной памяти.
Ты должен сначала эти данные куда-то загнать (размер буфера всего 256 КБ), дождаться готовности данных, выполнить вычисления шейдерным ядром, в конце выгрузить результаты.
Это даже не гиря на ногах, это кандалы. ))
V>>На самом деле верно, средняя производительность на ядро при той же частоте как раз выросла примерно на 60%, при этом часть добавочной производительности вовсе не заслуга ядра, а обновлённого IO, в т.ч. общения с RAM.
4>Если так рассматривать, то по сути до сих пор ничего не изменилось с момента появления Sandy Bridge.
Та да, тогда добавили кеш инструкций 0-го уровня.
С тех пор в поколениях изменения навроде таких:
Improvements
— Larger L2 caches (1.25 MB per core from 512 KB per core)
— Larger L3 caches (3 MB per core from 2 MB per core)
— A new AVX-512 instruction: Vector Pair Intersection to a Pair of Mask Registers, VP2INTERSECT[5][6]
— Control Flow Enforcement Technology to prevent return-oriented programming and jump-oriented programming exploitation techniques[7]
— Full memory (RAM) encryption[8]
— Indirect branch tracking and shadow stack
— Intel Key Locker[9][10]
— AVX/AVX2 instructions support for Pentium Gold and Celeron processors has been unlocked[6]
Заметных именно архитектурных изменений с 2012-го не было, с тех пор мы наблюдаем смерть десктопной x86/x64-архитектуры.
В последнем поколении они вообще оборзели — за новизну выдали сочетание жирных и тонких ядер на одном кристалле, нагло поменяв номер поколения, не изменив в другом вообще ничего.
Это уже всё, финита ля комедия.
V>>Предел развития суперскаляров был виден самой же Intel еще в конце 90-х, когда они разрабатывали 4-й пень, который работал на многих задачах хуже 3-го пня в пересчёте на частоту на ядро. Отсюда Itanium, который был похерен AMD через продление агонии x86-й архитектуры. ))
4>Убогоархитектурный P4 позволял по быстрому прощупать пределы тактовых частот, которые потом долгое время придётся использовать.
Мда... ))
P4 — это гипертрединг, это было серьезное отличие от предыдущих поколений.
Ничего убогого в этом нет, это был способ повысить эффективность использования ресурсов и это работает.
Правда, два потока на ядро ни о чём, некоторые процы-современники тогда показывали 4-8 потоков на ядро, ну да ладно...
В общем, последующие пни — по-сути эволюционное развитие именно того самого первого варианта 4-го пня (не берём линейку Atom).
Параллельно вернулись к ядрам от 3-го пня и сделали на их основе линейку Core, вернулись к гипертредингу позже.
4>IA-64 уступал по производительности AMD64, поэтому смысла в его существовании дальше не было.
Дудки, на момент выхода не уступал, а на многих задачах (на мультимедии, ИИ, шифровании и т.д.) — заметно превосходил.
Уступать стал позже, когда на него забили, по причине примерно нулевых продаж.
V>>Потому что x86 и ARM-ы могут в любой момент быть закрыты западными санкциями и мы можем остаться без процов.
4>Ничего особо не мешает штамповать клоны x86 и ARM по устаревшим ТП на маленьких заводиках в Китае
Устаревшие не нужны.
У нас MIPS и SPARC на уровне, они кратно лучше устаревших тех.
4>да и наличие т.н. "параллельного импорта" исключает возможность совсем остаться без процов, поставки только сократятся, и ценник будет выше, но всё-равно это дешевле, чем делать свою архитектуру и так-же её производить на маленьких заводиках в Китае.
На маленьких заводиках, говоришь? ))
V>>Поэтому и продолжают у нас развивать MIPS, SPARC и Эльбрус.
V>>Первый для контроллеров, второй для чего-то некритичного к вычислениям, последний — серьёзная числомолотилка.
4>
4>... первоначально инженеры из IBM пытались при создании SPE следовать канонам VLIW, однако столкнулись с серьезными проблемами и вернулись к уже хорошо обкатанной архитектуре SIMD-сопроцессора Altivec/VMX.
Да всем похрен, что конкретно IBM ниасилили.
IBM никогда не отличалась в эффективных вычислениях, всю свою историю она клепала машинки "для бизнеса".
С бюджетом в десятки раз меньшем когда-то Cray их нагнул как маленьких детей в нише числодробилок.
Мне было бы стыдно...
4>Так вот, почти весь жизненный цикл этих консолей (7 лет) разработчики под PS3 пытались раскрыть тот самый потенциал SPE, но удавалось это только в единичных случаях (и при активном участии со стороны Sony/IBM), а основной ширпотреб (кроссплатформа) была в пользу XBox 360, в основном за счёт сложностей связанных с использованием SPE.
Потому что гибридный код для двух архитектур одновременно — это хуже гири на ногах.
Представь, у тебя на обычном С++ только main, а потом на покалеченном языке, навроде самых первых версий языков для шейдеров, ты пишешь остальную программу?
Причём, со всеми прелестями шейдеров, когда у тебя нет доступа к объектам/данным из обычной памяти.
Ты должен сначала эти данные куда-то загнать (размер буфера всего 256 КБ), дождаться готовности данных, выполнить вычисления шейдерным ядром, в конце выгрузить результаты.
Это даже не гиря на ногах, это кандалы. ))