палко-часы и цп или поджарить попугаев
От: мыщъх США http://nezumi-lab.org
Дата: 19.05.15 20:19
Оценка:
в соседней ветке человек собирает компьютер и спрашивает совета. я тоже хочу. и совета и компьютер.

желание иметь компьютер, который можно разместить в корпусе сервера, выдранного с мясом из рэка. хотя это не принципиально.

в игры играть мне не надо. мне надо компилировать и запускать много виртуальных машин одновременно.

выбираю процессор. смотрю в книгу, вижу фигу:
https://www.cpubenchmark.net/high_end_cpus.html

скажите, топовый процессор у которого 24,601 попугаев действительно быстрее процессора у которого всего лишь ~8,000 попугаев как у меня сейчас на ноуте. разницу в скорости будет можно заметить на задачах типа компиляции? или разница нивелируется вводом-ввыводом? кстати, о вводе-выводе. что-то разницы нет между компилятором под виртуалкой с классическим hdd и _сжатым_ виртуальным диском (NTFS компрессия) и компилятором под живым ЦП (на идентичном ноуте) с самым быстрым SSD. так что я делаю вывод, что мой ввод не является узким местом для компилятора. а что является? процессор? памяти если что с запасом.


дальше еще вопрос про материнские платы. какие из них есть и чем отличаются. что-то давно не следил за новостями и отстал от жизни. какая сейчас самая быстрая память и сколько там каналов чтобы было в паре. и влияет ли оно на производительность если у процессора много попугаев и емкий кэш?

заранее спасибо

ЗЫ. бюджет неопределенный. но хотелось бы чтобы компьютер был не дороже автомобиля.
americans fought a war for a freedom. another one to end slavery. so, what do some of them choose to do with their freedom? become slaves.
Re: палко-часы и цп или поджарить попугаев
От: SkyDance Земля  
Дата: 19.05.15 23:31
Оценка:
М>желание иметь компьютер, который можно разместить в корпусе сервера, выдранного с мясом из рэка. хотя это не принципиально.

Купи сервер. Это будет дешевле, удобнее и в корпусе сервера. Но помни, что серверы делают не чтоб тихо было, а чтоб охлаждалось нормально. Хотя у меня на работе под столом 2 штуки 1U supermicro веду себя тихо.

В твоем случае лучше смотреть на SuperMicro, у них удобная warranty policy (можешь менять компоненты без потери гарантии). Сразу привезут готовый. Из плюсов — будет много слотов под RAM, что для виртуалок критично.

М>в игры играть мне не надо. мне надо компилировать и запускать много виртуальных машин одновременно.


Тогда серверное железо — самое то.

М>скажите, топовый процессор у которого 24,601 попугаев действительно быстрее процессора у которого всего лишь ~8,000 попугаев как у меня сейчас на ноуте. разницу в скорости будет можно заметить на задачах типа компиляции?


Если под компиляцией понимать С++, то — да, разница будет заметна невооруженным глазом. Хотя между 16.000 и 24.000 попугаев уже не так видно разницу.

М>или разница нивелируется вводом-ввыводом? кстати, о вводе-выводе. что-то разницы нет между компилятором под виртуалкой с классическим hdd и _сжатым_ виртуальным диском (NTFS компрессия) и компилятором под живым ЦП (на идентичном ноуте) с самым быстрым SSD. так что я делаю вывод, что мой ввод не является узким местом для компилятора. а что является? процессор? памяти если что с запасом.


Посмотри resource monitor. В первую очередь обрати внимание на загрузку всех ядер CPU. Может, твой компилятор не распараллелен? Сколько потоков компиляции, столько же, сколько ядер, или нет? Если ты работаешь с С++ с тяжелыми шаблонами, упор почти всегда в CPU. Ввод-вывод обычно кэшируется (если памяти хватает).

М>дальше еще вопрос про материнские платы. какие из них есть и чем отличаются. что-то давно не следил за новостями и отстал от жизни. какая сейчас самая быстрая память и сколько там каналов чтобы было в паре. и влияет ли оно на производительность если у процессора много попугаев и емкий кэш?


Платы отличаются чипсетами и поддерживаемыми фичами. Если нужно много виртуалок, основное — это память. В зависимости от виртуализируемой ОС, может требоваться до 16 Гб памяти на виртуалку. В памяти самое главное — объем. Каналы, скорость и прочее на производительность влияют мало.
На компиляцию влияет всё. В первую очередь ядра. Кэш тоже (хотя меньше).
Re: палко-часы и цп или поджарить попугаев
От: Aртём Австралия жж
Дата: 21.05.15 08:19
Оценка:
Здравствуйте, мыщъх, Вы писали:

М>выбираю процессор. смотрю в книгу, вижу фигу:

М>https://www.cpubenchmark.net/high_end_cpus.html

По ссылке забавная вещь: Atom C2750 выдал 3900 попугаев в термопакете 20 Вт, 8 ядер, 64G адресное пространство, и заборол i5-2390T (3900 попугаев) — 35 Вт, 2 ядра с HT, 32G адресуется.

PS Мощный комп и виртуалки для компилятора, возможно, не нужны.
Re[2]: палко-часы и цп или поджарить попугаев
От: SkyDance Земля  
Дата: 21.05.15 22:55
Оценка:
Aё>По ссылке забавная вещь: Atom C2750 выдал 3900 попугаев в термопакете 20 Вт, 8 ядер, 64G адресное пространство, и заборол i5-2390T (3900 попугаев) — 35 Вт, 2 ядра с HT, 32G адресуется.

2390T еще с 2013 года discontinued. Плюс ты спутал max TDP с реальным TDP.
Re[3]: палко-часы и цп или поджарить попугаев
От: Aртём Австралия жж
Дата: 22.05.15 00:22
Оценка:
Здравствуйте, SkyDance, Вы писали:

Aё>>По ссылке забавная вещь: Atom C2750 выдал 3900 попугаев в термопакете 20 Вт, 8 ядер, 64G адресное пространство, и заборол i5-2390T (3900 попугаев) — 35 Вт, 2 ядра с HT, 32G адресуется.


SD>2390T еще с 2013 года discontinued.

Вроде ж производительность ещё с 2010 не растёт? Так что мимо кассы.


SD> Плюс ты спутал max TDP с реальным TDP.

Я указал теплопакет. Оба проца могут турбобуст, оба могут VT. Только более свежий атом холодней и дешевле, чем i5 T. Но маркетинг тебе внушил, что циферка в модели намекает на быстродействие.
Re[4]: палко-часы и цп или поджарить попугаев
От: SkyDance Земля  
Дата: 22.05.15 00:37
Оценка: 2 (1)
Aё>Вроде ж производительность ещё с 2010 не растёт? Так что мимо кассы.

Максимальная производительность не растёт. Тогда как производительность на ватт — ровно то, чем занимался интел последние лет 5-7. Собственно, ты ровно это и видишь в тестах — процессор пятилетней давности с бОльшим TDP в тестах CPU равен современному с мЕньшим.

Aё>Я указал теплопакет.


Ты не понимаешь значения этой аббревиатуры.
TDP определяется Интелом по их внутренной методике. По какому-то их workload. Тестирование по методике cpubenchmark создает какую-то другую нагрузку. Вполне вероятно, что реальное тепловыделение процессоров одинаково. Впрочем, чисто исходя из физики процесса, 22 нм техпроцесс (атом) должен быть экономичнее 32 нм (древний i5). Насколько — нужно измерять непосредственно.

Aё>Но маркетинг тебе внушил, что циферка в модели намекает на быстродействие.


Номер модели не то что намекает, а конкретно показывает быстродействие. В пределах одного поколения. Тебя же не удивляет, что нынешние дешевые Pentium'ы быстрее каких-нибудь квод-экстримов десятилетней давности? Маркетинг тут не при чем.
Re[5]: палко-часы и цп или поджарить попугаев
От: Aртём Австралия жж
Дата: 22.05.15 00:46
Оценка:
Здравствуйте, SkyDance, Вы писали:

Aё>>Я указал теплопакет.


SD>Ты не понимаешь значения этой аббревиатуры.

SD>TDP определяется Интелом по их внутренной методике. По какому-то их workload. Тестирование по методике cpubenchmark создает какую-то другую нагрузку. Вполне вероятно, что реальное тепловыделение процессоров одинаково. Впрочем, чисто исходя из физики процесса, 22 нм техпроцесс (атом) должен быть экономичнее 32 нм (древний i5). Насколько — нужно измерять непосредственно.
Теплопакет означает требуемое охлаждение и требования к БП. Твои рассуждения не имеют практической ценности кроме философской.

Aё>>Но маркетинг тебе внушил, что циферка в модели намекает на быстродействие.


SD>Номер модели не то что намекает, а конкретно показывает быстродействие. В пределах одного поколения. Тебя же не удивляет, что нынешние дешевые Pentium'ы быстрее каких-нибудь квод-экстримов десятилетней давности? Маркетинг тут не при чем.

Ещё как причём- производительность от поколения к поколению не растёт для i3..i7. Кстати, нынешные Пентиумы- это переименованные по маркетинговым причинам Атомы.
Re[2]: палко-часы и цп или поджарить попугаев
От: Evgeny.Panasyuk Россия  
Дата: 22.05.15 00:58
Оценка:
Здравствуйте, SkyDance, Вы писали:

SD>В памяти самое главное — объем. Каналы, скорость и прочее на производительность влияют мало.


На производительность чего?
Когда данные уже в памяти, то есть не считая всякого рода IO — большинство программ упираются именно в память (latency и throughput).
Re[3]: палко-часы и цп или поджарить попугаев
От: SkyDance Земля  
Дата: 22.05.15 01:19
Оценка: +2
EP>На производительность чего?

На производительность в терминах "сколько юзеру ждать завершения вот этой его задачи". В бытовом понимании вопроса. То, что высокочастотная память с низкими задержками может на какой-то редкой задаче дать выигрыш ажно в 10% — да, может. Но такие задачи у домашних пользователей почти не встречаются. Редко кто обсчитывает большие нейронные сети дома. И те, кто обучают, те и так в курсе требуемых характеристик памяти.

Если кратко: DDR3-2133 будет стоить дороже, чем 1600, а выигрыш на большинстве задач будет менее заметен, чем если бы на разницу в цене купить больше памяти.
Re[6]: палко-часы и цп или поджарить попугаев
От: SkyDance Земля  
Дата: 22.05.15 01:22
Оценка:
Aё>Ещё как причём- производительность от поколения к поколению не растёт для i3..i7.

Растёт.
Производительность на ватт — растёт еще быстрее. Что ты и заметил, сравнив древний процессор с современным. Зачем ты вообще приплёл маркетинг? Какой еще маркетинг может быть у i5-2390T, если он уже года три как не продается?
Re[7]: палко-часы и цп или поджарить попугаев
От: Aртём Австралия жж
Дата: 22.05.15 01:32
Оценка:
Здравствуйте, SkyDance, Вы писали:

Aё>>Ещё как причём- производительность от поколения к поколению не растёт для i3..i7.


SD>Растёт.

5% в год? Это не рост. Производительность встроенного GPU растёт, это да. Если кому с печкой это важно .

SD>Производительность на ватт — растёт еще быстрее. Что ты и заметил, сравнив древний процессор с современным. Зачем ты вообще приплёл маркетинг? Какой еще маркетинг может быть у i5-2390T, если он уже года три как не продается?

Прекратили выпуск в 2013 году, значит года 1-2 не продаётся. Что не мешает ему быть аж на 5% медленнее своих более свежих современников.
Re[4]: палко-часы и цп или поджарить попугаев
От: Evgeny.Panasyuk Россия  
Дата: 22.05.15 02:08
Оценка:
Здравствуйте, SkyDance, Вы писали:

EP>>На производительность чего?

SD>На производительность в терминах "сколько юзеру ждать завершения вот этой его задачи". В бытовом понимании вопроса.

Я всё же не пойму о каких задачах ты говоришь, если о тех которые упираются в медленное IO, или например о тех где скорость не важна до такой степени что разница в разы незаметна пользователю, то тут и быстрый CPU вообще-то не нужен

SD>То, что высокочастотная память с низкими задержками может на какой-то редкой задаче дать выигрыш ажно в 10% — да, может.


Ты сильно недооцениваешь влияние памяти на общую скорость. При разработке быстрого кода после алгоритмических оптимизаций по значимости часто идёт оптимизация работы с памятью — так как в большинстве случаев она является bottleneck'ом.
Вклад latency и throughput в общее время работы типичного кода, не считая IO — огромны, я бы сказал что часто этот вклад превышает 80% от общего времени.

SD>Но такие задачи у домашних пользователей почти не встречаются.


Например обработка много-мегапиксельных фоток — это редкая задача?
Отредактировано 22.05.2015 2:10 Evgeny.Panasyuk . Предыдущая версия .
Re[2]: палко-часы и цп или поджарить попугаев
От: mik1  
Дата: 22.05.15 02:28
Оценка:
Здравствуйте, Aртём, Вы писали:

М>>выбираю процессор. смотрю в книгу, вижу фигу:

М>>https://www.cpubenchmark.net/high_end_cpus.html

Aё>По ссылке забавная вещь: Atom C2750 выдал 3900 попугаев в термопакете 20 Вт, 8 ядер, 64G адресное пространство, и заборол i5-2390T (3900 попугаев) — 35 Вт, 2 ядра с HT, 32G адресуется.

Странные процы сравниваете.
Слабый десктоп на 2 ядрах с "топовым" атомом на 8 физических ядрах.
Атом этот обычный пользователь не достанет, а если и достанет, то удавится от "производительности" одиночных ядер.

В любом случае оба этих проца чертовски медленные. Даже мой древний ультрабуковый Core i5-3337U рядом с ними по производительности, а уж как он тормозит я прекрасно знаю.

Полезные процы в этой табличке идут от десяточки килопопугаев. И вот там уже либо последние поколения десктопа, либо зионы последних 3 поколений.
Re[8]: палко-часы и цп или поджарить попугаев
От: SkyDance Земля  
Дата: 22.05.15 03:08
Оценка:
Aё>Прекратили выпуск в 2013 году, значит года 1-2 не продаётся. Что не мешает ему быть аж на 5% медленнее своих более свежих современников.

Относительно свежий 35 Вт современник — Intel Core i5-4590T — 5500 попугаев. Почти в полтора раза разница.
Re[9]: палко-часы и цп или поджарить попугаев
От: Aртём Австралия жж
Дата: 22.05.15 03:18
Оценка:
Здравствуйте, SkyDance, Вы писали:

SD>Относительно свежий 35 Вт современник — Intel Core i5-4590T — 5500 попугаев. Почти в полтора раза разница.

Т.е. это горячий i7 производительность не растёт? Вроде ты сам сидишь на древнем i7 и в ус не дуешь.
Re[5]: палко-часы и цп или поджарить попугаев
От: SkyDance Земля  
Дата: 22.05.15 03:25
Оценка:
EP>Я всё же не пойму о каких задачах ты говоришь, если о тех которые упираются в медленное IO

Они самые. Медленное I/O или упор в видеокарту. Про "быстрый CPU не нужен" тоже верно — дома он обычно не нужен.

EP>Например обработка много-мегапиксельных фоток — это редкая задача?


Это задача, на которую объем памяти оказыват бОльшее влияние, чем ее задержки или пропускная способность (потому что большая часть вычислений идет в кэше процессора).

Вообще, все уже украдено до нас: разница в между самой быстрой DDR3-2933 и дешевой DDR3-1600 Photoshop CC составляет "оглушительные" 9%. Это в тесте, который полностью отвязан от I/O. Если в этот тест включить антивирус в фоновом режиме (или браузер с включенным жабаскриптом и 30 окошками), выгоднее будет иметь 16 Гб памяти DDR-1600, чем 8 Гб 2933.

Есть только один тест, который еще больше зависит от памяти — архивация с "тяжелыми" настройками.
Re[10]: палко-часы и цп или поджарить попугаев
От: SkyDance Земля  
Дата: 22.05.15 03:33
Оценка:
Aё>Т.е. это горячий i7 производительность не растёт?

Тоже растёт — было 8,887 (2700K, на котором я сижу) супротив 11,245 (4790K). Но рост на 27% не так заметен. Плюс к тому Sandy Bridge намного охотнее разгоняется, тогда как 4790K еще на фабрике разогнан почти до упора. На большинстве задач прирост незаметен. Просто потому, что 2700К хватает. Вот потому Intel и не чешется выпускать более быстрые десктопные процессоры — они не особо нужны. Будущий SkyLake будет на 10-15% быстрее Haswell, что может дать искомые "в 1.5 раза" с Sandy Bridge. Тогда можно будет и обновиться. А сейчас апгрейд быссмысленен — грядет переход на DDR4, плюс опять новый сокет.
Re[3]: палко-часы и цп или поджарить попугаев
От: Aртём Австралия жж
Дата: 22.05.15 04:39
Оценка:
Здравствуйте, mik1, Вы писали:

M>В любом случае оба этих проца чертовски медленные. Даже мой древний ультрабуковый Core i5-3337U рядом с ними по производительности, а уж как он тормозит я прекрасно знаю.

Слабее на 15%: Intel Core i5-3337U 3,239 vs Atom C2750 3,929 при теплопакете 17 и 20Вт, соответственно.

M>Полезные процы в этой табличке идут от десяточки килопопугаев. И вот там уже либо последние поколения десктопа, либо зионы последних 3 поколений.

Главный вопрос тут- чем таким нагрузить надо эти процы. Например, мой i7 4770 9,867 с тех пор, как поставил нормальную ось на ультрабук c Pentium N3540 1799 7.5Вт, лишь крутит нетфликс на телеке.
Re[6]: палко-часы и цп или поджарить попугаев
От: Evgeny.Panasyuk Россия  
Дата: 22.05.15 05:05
Оценка:
Здравствуйте, SkyDance, Вы писали:

EP>>Я всё же не пойму о каких задачах ты говоришь, если о тех которые упираются в медленное IO

SD>Они самые.

А как они относятся к этому топику?

SD>Медленное I/O или упор в видеокарту.


Видеокарты (и GPGPU в частности) выигрывают в том числе за счёт того что у их памяти throughput на порядок больше чем у памяти CPU.

SD>Про "быстрый CPU не нужен" тоже верно — дома он обычно не нужен.

EP>>Например обработка много-мегапиксельных фоток — это редкая задача?
SD>Это задача, на которую объем памяти оказыват бОльшее влияние,

Например памяти столько, что в неё всё-всё помещается — и её добавление уже ничем не поможет

SD>чем ее задержки или пропускная способность (потому что большая часть вычислений идет в кэше процессора).


Это зависит от алгоритма — многие алгоритмы делают линейный проход по памяти. Например наложение маски на изображение, или применение кисти.
Алгоритмы которые многократно используют значения из кэша встречаются намного реже, типа умножения плотных матриц (GEMM). И да, для них throughput менее актуален.

SD>Вообще, все уже украдено до нас: разница в между самой быстрой DDR3-2933 и дешевой DDR3-1600 Photoshop CC составляет "оглушительные".


Разница в memory read (тот самый throughput) между DDR3-2933 и DDR3-1600 — 30%. На фоне того что там есть(?) какие-никакие вещественные вычисления, которых нет во многих задачах — 9% как раз и показывают что скорость памяти влияет существенно.
Плюс надо смотреть что там конкретно тестируется — там скорей всего выводится среднее время ряда действий. Какая-нибудь свёртка, типа gaussian blur с большим радиусом, действительно многократно использует загруженные значения в кэш, и зависит от throughput меньше, чем применение кисти. Если усреднять их время — то получим "среднюю температуру по больнице"

SD>Это в тесте, который полностью отвязан от I/O. Если в этот тест включить антивирус в фоновом режиме (или браузер с включенным жабаскриптом и 30 окошками), выгоднее будет иметь 16 Гб памяти DDR-1600, чем 8 Гб 2933.


А я не говорил что нужно ставить меньше памяти до такой степени что начнётся I/O.
Re[7]: палко-часы и цп или поджарить попугаев
От: SkyDance Земля  
Дата: 22.05.15 05:31
Оценка:
EP>А как они относятся к этому топику?

Напрямую. Цитирую первое сообщение:

в игры играть мне не надо. мне надо компилировать и запускать много виртуальных машин одновременно.


В таких условиях, как я уже неоднократно написал, объем памяти намного важнее ее пропускной способности или латентности.
Вот если бы тредстартер спрашивал про обучение нейронных сетей, тогда имело бы смысл обратить внимание на параметры памяти (в первую очередь на, хехе, ECC).

EP>Видеокарты (и GPGPU в частности) выигрывают в том числе за счёт того что у их памяти throughput на порядок больше чем у памяти CPU.


Так у видеокарт тысячи потоковых процессоров. А не единицы.

EP>Например памяти столько, что в неё всё-всё помещается — и её добавление уже ничем не поможет


Вот именно это условие никогда не удовлетворяется при запуске "много виртуальных машин". Я много лет работаю с виртуализацией серверов, и уж поверьте, самое важное в этом деле — объем памяти (и IOPS/sec дисковой подсистемы — суть обязательное наличие SSD).

EP>Разница в memory read (тот самый throughput) между DDR3-2933 и DDR3-1600 — 30%. На фоне того что там есть(?) какие-никакие вещественные вычисления, которых нет во многих задачах — 9% как раз и показывают что скорость памяти влияет существенно.


Так а я что написал? Что в лучшем случае можно получить 9% выигрыш на задачах без I/O. Это попросту не заметить в домашнем применении. А вот тормоза от 3-4 виртуалок, которые свопятся, видны будут самым что ни на есть невооруженным глазом.

EP>А я не говорил что нужно ставить меньше памяти до такой степени что начнётся I/O.


Виртуалки ведут постоянный I/O. Немного, но этого хватает, чтобы скоростные характеристики памяти не дадут даже 9% прироста. На самом деле, да 2-3% не факт что будет.
И я не говорил про нехватку памяти до свопа. Даже без этого — дисковое кэширование куда эффективнее при наличии большого количества свободной памяти.
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.