Здравствуйте, Cyberax, Вы писали:
C>Здравствуйте, Kernighan, Вы писали:
D>>>>Интересно, что мешает сделать нормальную частоту на таком техпроцессе? C>>>Совершенно непонятная фиксация на VLIW? K>>Чем тебе не нравится VLIW и как она связана с частотой? C>VLIW требует героических подвигов со стороны компиляторов. Проблема оказывается в том, что среди компиляторов героев не наблюдается. И исправить это на уровне железа очень сложно, так как стандартные методы ускорения (автоматическое out-of-order планирование, хитрое предсказание переходов) становятся слишком дорогими из-за сложности инструкций. Скорее всего, они героически это преодолели, истратив транзисторный бюджет.
Вот очень характерный пример, как можно знать слова и не понимать их смысл.
Зачем нужен out-of-order? Ну вот просто подумать? Да потому что команды стоят в неправильном порядке.
Почему бы их не поставить сразу в правильном? Да, для этого нужен компилятор. Ну так он есть.
При этом из процессора исключаются блоки, которые занимаются этим самым out-of-order.
Всё ровно наоборот по сравнению с тем, что ты написал.
CISC (с его разной длинной команд) почему-то частоте не мешает, а VLIW видите ли мешает.
Тебе самому не смешно?
C>Дополнительно, VLIW существенно затрудняет создание глубоких pipeline'ов (по тем же причинам), которые являются простейшим способом увеличить частоту.
Каким образом VLIW "существенно затрудняет создание глубоких pipeline'ов"?
Ааа! Я знаю. Исчезает несколько стадий конвейера, которые делают из команд разной длинны
команды одной длинны, которым можно манипулировать при загрузке АЛУ.
Конвейер при этом становится короче. Ну так это же хорошо.
C>В итоге, VLIW для CPU в индустрии умер совсем везде. Он неплохо сейчас живёт разве что только в области GPU, где примерно половина встроенных GPU построена на VLIW-подобной архитектуре.
Мне одному видится здесь прямое противоречие?
В процессорах сейчас умерло всё, кроме Интела и ARM.
Вот только к качествам процессоров и уж тем более системе команд это не имеет никакого отношения.
Здравствуйте, Pzz, Вы писали:
Pzz>Здравствуйте, Kernighan, Вы писали:
K>>Азы рыночной экономики состоят в том, что всё покупается за деньги. K>>Потому что продать гораздо труднее, чем купить.(с) K>>Не веришь мне — спроси у qwerty.
Pzz>Правда заключается в том, что за деньги можно купить то же, что всем прочим массово впаривают. А когда хочется купуть что-нибудь необычное с преподвыпердом, поди попробуй найди того, кто тебе такое сделает и продаст.
Ну правильно. Именно поэтому и нужно делать своё.
Чтобы не попадать в технологический тупик.
Весь смысл Эльбруса именно в этом.
Да, кстати, ты знаешь, что у Эльбруса есть специфичная фишка — тегированная память?
Здравствуйте, Osaka, Вы писали:
LVV>>Неужели доживу — куплю НАШ компьютер ?! O>Наши культурные традиции взаимоотношений на предприятиях породят 8-ядерное жигули.
Здравствуйте, Cyberax, Вы писали:
C>Ну так объясняю очень просто — основной проблемой для поднятия частоты является тепловыделение. Оно примерно линейно падает с уменьшением размеров транзисторов.
И, одновременно, усложняется отвод тепла с маленького кристалла
Итого — никакого видимого прогресса, и i7 14нм 7го поколения греются так же охотно, как и 2го 32нм. (Базовая частота отличается всего на 0.8ггц, бустовая на 0.7ггц. Или на ~20%). TDP тоже схож, 91 / 95вт.
Где выгода от техпроцесса ? Из одной пластины можно больше кристаллов нарезать, разве что.
Здравствуйте, IID, Вы писали:
IID>Здравствуйте, Cyberax, Вы писали:
C>>Ну так объясняю очень просто — основной проблемой для поднятия частоты является тепловыделение. Оно примерно линейно падает с уменьшением размеров транзисторов.
IID>И, одновременно, усложняется отвод тепла с маленького кристалла IID>Итого — никакого видимого прогресса, и i7 14нм 7го поколения греются так же охотно, как и 2го 32нм. (Базовая частота отличается всего на 0.8ггц, бустовая на 0.7ггц. Или на ~20%). TDP тоже схож, 91 / 95вт.
IID>Где выгода от техпроцесса ? Из одной пластины можно больше кристаллов нарезать, разве что.
Здравствуйте, IID, Вы писали:
IID>Здравствуйте, Cyberax, Вы писали:
C>>Ну так объясняю очень просто — основной проблемой для поднятия частоты является тепловыделение. Оно примерно линейно падает с уменьшением размеров транзисторов.
IID>И, одновременно, усложняется отвод тепла с маленького кристалла IID>Итого — никакого видимого прогресса, и i7 14нм 7го поколения греются так же охотно, как и 2го 32нм. (Базовая частота отличается всего на 0.8ггц, бустовая на 0.7ггц. Или на ~20%). TDP тоже схож, 91 / 95вт.
Ну как бэ при прочих равных в 14нм можно больше всякого продвинутого функционала запихать + ядер может быть больше за тот же "мощностной" бюджет.
Здравствуйте, Sharov, Вы писали:
S>Ну как бэ при прочих равных в 14нм можно больше всякого продвинутого функционала запихать + ядер может быть больше за тот же "мощностной" бюджет.
В теории. А на практике надо их ещё как-то остудить, прокачав такое же количество тепла, но через значительно меньший объём кремния. Для i9 анонсировали водянку от интела, видимо воздух уже не справляется.
Здравствуйте, Klikujiskaaan, Вы писали:
K>Ну, в топовый i9 запихали аж 18 ядер.
Которые официально предлагают остужать водянкой
ИМХуется мне, что и с водянкой нагрев будет оооочень неслабым, т.к. боксовая AIO водянка врядли будет лучше топового воздуха. Не исключаю мгновенный уход в троттлинг, при 100% загрузке синтетикой. И снижение базовых частот до кучи, в сравнении с менее ядерными собратьями.
kalsarikännit
Re[4]: Подскажите как сейчас принято искать работу
Здравствуйте, pestis, Вы писали:
P>Детерменированный паралелизм. Для определенных задач позволяет добиться существенного прироста по сравнению с устарелой x86, так что я бы в него палочкой потыкал.
FPGA. А VLIW пусть закапывают обратно.
Re[11]: Подскажите как сейчас принято искать работу
Здравствуйте, IID, Вы писали:
IID>Итого — никакого видимого прогресса, и i7 14нм 7го поколения греются так же охотно, как и 2го 32нм. (Базовая частота отличается всего на 0.8ггц, бустовая на 0.7ггц. Или на ~20%). TDP тоже схож, 91 / 95вт.
Это потому что нанометры уже довольно давно стали маркетинговыми, и фактически техпроцесс 14 нм мало чем отличается от 32. Пара элементов там размера 14 нм, а все остальные — куда как больше.
Здравствуйте, Cyberax, Вы писали:
C>Современные Intel'ы внутри так и работают — предсказатель переходов, по сути, и есть "перекомпиляция на лету". Туда ещё добавляется и спекулятивное исполнение, когда CPU одновременно исполняет обе ветки if'а до тех пор, пока точно не станет известен результат сравнения.
Вычислительные блоки GPU так работали — по крайней мере раньше, во времена SM 2/3.
Здравствуйте, IID, Вы писали:
IID>Итого — никакого видимого прогресса, и i7 14нм 7го поколения греются так же охотно, как и 2го 32нм. (Базовая частота отличается всего на 0.8ггц, бустовая на 0.7ггц. Или на ~20%). TDP тоже схож, 91 / 95вт.
Это намеренно — процессор делают из расчёта на определённый термальный бюджет. На мобильных устройствах по-другому — там часть выигрыша пустят на уменьшение энергопотребления, и часть на улучшение производительности.
IID>Где выгода от техпроцесса ? Из одной пластины можно больше кристаллов нарезать, разве что.
Можно больше транзисторов запихать — больше ядер, кэша, фич и т.д.
Здравствуйте, Kernighan, Вы писали:
C>>VLIW требует героических подвигов со стороны компиляторов. Проблема оказывается в том, что среди компиляторов героев не наблюдается. И исправить это на уровне железа очень сложно, так как стандартные методы ускорения (автоматическое out-of-order планирование, хитрое предсказание переходов) становятся слишком дорогими из-за сложности инструкций. Скорее всего, они героически это преодолели, истратив транзисторный бюджет. K>Вот очень характерный пример, как можно знать слова и не понимать их смысл. K>Зачем нужен out-of-order? Ну вот просто подумать? Да потому что команды стоят в неправильном порядке.
Правильно.
K>Почему бы их не поставить сразу в правильном? Да, для этого нужен компилятор. Ну так он есть.
Потому, что статически это не всегда возможно.
K>При этом из процессора исключаются блоки, которые занимаются этим самым out-of-order.
Не исключают. В Itanic'е они тоже невозбранно появились, после того, как первая модель потонула.
Ещё более показательный пример — это delay slots в Sparc'ах.
K>CISC (с его разной длинной команд) почему-то частоте не мешает, а VLIW видите ли мешает.
CISC в современных процессорах декодируется в набор микроинструкций, которые анализируются и конвейеризуются. С VLIW это делать... эээ... ну как заниматься сексом в лыжах на гамаке.
C>>Дополнительно, VLIW существенно затрудняет создание глубоких pipeline'ов (по тем же причинам), которые являются простейшим способом увеличить частоту. K>Каким образом VLIW "существенно затрудняет создание глубоких pipeline'ов"?
Для глубокого конвейера нужно знать зависимости по данным между командами, с VLIW это делать трудно из-за сложности инструкций. Дополнительно, нужен предсказатель переходов, чтобы минимизировать срывы конвейера — см. выше про сложность инструкций.
K>В процессорах сейчас умерло всё, кроме Интела и ARM.
Бредим. RISC-и разного рода рулят везде: POWER прекрасно существует на суперкомпьютерах, MIPS живёт в сетевых устройствах (и местами в суперкомпьютерах в Китае). VLIW, ЧСХ, в CPU помер совсем везде.
Здравствуйте, Kernighan, Вы писали:
LVV>>>Неужели доживу — куплю НАШ компьютер ?! O>>Наши культурные традиции взаимоотношений на предприятиях породят 8-ядерное жигули.
K>А почему не восьмиядерный Су-27?
потому что су 27 — специальная техника, а жигули гражданская техника общего назначения.
Здравствуйте, pestis, Вы писали:
Pzz>>А никто не пробовал применять комбинированный подход, когда процессор собирает детальные метрики, а just in time recompiler перекомпилирует узкие места с их учетом?
P>Непонятно как эти метрики привязать к тем абстракциям, с которыми работает компилятор. А так подход рабочий, ява машины чем-то подобным занимаются.
Ну процессор-то что-то с этими метриками делает. Значит, и софтварий может. Причем у него это лучше получится, ему не надо экономить транзисторы.
Здравствуйте, Cyberax, Вы писали:
Pzz>>А никто не пробовал применять комбинированный подход, когда процессор собирает детальные метрики, а just in time recompiler перекомпилирует узкие места с их учетом? C>Современные Intel'ы внутри так и работают — предсказатель переходов, по сути, и есть "перекомпиляция на лету". Туда ещё добавляется и спекулятивное исполнение, когда CPU одновременно исполняет обе ветки if'а до тех пор, пока точно не станет известен результат сравнения.
Это я в курсе. Но достижимая сложность процессора ограничена в гораздо большей степени, чем достижимая сложность софтвария.
Здравствуйте, Kernighan, Вы писали:
K>Ну правильно. Именно поэтому и нужно делать своё. K>Чтобы не попадать в технологический тупик. K>Весь смысл Эльбруса именно в этом.
Я что, против делать свое?
K>Да, кстати, ты знаешь, что у Эльбруса есть специфичная фишка — тегированная память?
Слышал краем уха. А из Си это в каком виде доступно?
Re[12]: Подскажите как сейчас принято искать работу
Здравствуйте, Kesular, Вы писали:
K>Здравствуйте, IID, Вы писали:
IID>>Итого — никакого видимого прогресса, и i7 14нм 7го поколения греются так же охотно, как и 2го 32нм. (Базовая частота отличается всего на 0.8ггц, бустовая на 0.7ггц. Или на ~20%). TDP тоже схож, 91 / 95вт.
K>Это потому что нанометры уже довольно давно стали маркетинговыми, и фактически техпроцесс 14 нм мало чем отличается от 32. Пара элементов там размера 14 нм, а все остальные — куда как больше.
Ыменно. Особенно проводники. Особенно верхних слоёв.
И не потому, что нельзя сделать более мелкий фотошаблон.
А потому что тонкий проводник рвётся на неровном основании.
Здравствуйте, IID, Вы писали:
IID>Здравствуйте, Kernighan, Вы писали:
K>>Ну у меня регалии повыше. Я их потом скажу, когда ты более акцентированно облажаешься.
IID>Раз ты в теме — можешь прокомментировать мнение оверклокера