Re[8]: палко-часы и цп или поджарить попугаев
От: Evgeny.Panasyuk Россия  
Дата: 22.05.15 07:31
Оценка:
Здравствуйте, SkyDance, Вы писали:

EP>>Видеокарты (и GPGPU в частности) выигрывают в том числе за счёт того что у их памяти throughput на порядок больше чем у памяти CPU.

SD>Так у видеокарт тысячи потоковых процессоров. А не единицы.

У видеокарт два больших преимущества: много FLOP/s (да и вообще OP/s) и много memory throughput. Необходимость программировать тысячи вычислительных единиц в виде десятков тысяч потоков (причём частично зависимых друг от друга — warps и blocks) — это минус, а не плюс.
Так вот, с CPU на GPGPU переносят в том числе и алгоритмы которые упираются в throughput (а не в OP/s), как раз потому что этого throughput и не хватает.

EP>>Например памяти столько, что в неё всё-всё помещается — и её добавление уже ничем не поможет

SD>Вот именно это условие никогда не удовлетворяется при запуске "много виртуальных машин". Я много лет работаю с виртуализацией серверов, и уж поверьте, самое важное в этом деле — объем памяти (и IOPS/sec дисковой подсистемы — суть обязательное наличие SSD).

Охотно верю. Я не говорил что объём не важен.

EP>>Разница в memory read (тот самый throughput) между DDR3-2933 и DDR3-1600 — 30%. На фоне того что там есть(?) какие-никакие вещественные вычисления, которых нет во многих задачах — 9% как раз и показывают что скорость памяти влияет существенно.

SD>Так а я что написал? Что в лучшем случае можно получить 9% выигрыш на задачах без I/O. Это попросту не заметить в домашнем применении.

9% (а в некоторых тестах по той ссылке до 25%) при 30% увеличении throughput, и это только при увеличении частоты. Ты же изначально говорил ещё и про каналы памяти.

SD>А вот тормоза от 3-4 виртуалок, которые свопятся, видны будут самым что ни на есть невооруженным глазом.

EP>>А я не говорил что нужно ставить меньше памяти до такой степени что начнётся I/O.
SD>Виртуалки ведут постоянный I/O.

У меня есть VM в которой практически никакого I/O кроме линейного начального — на ramdisk распаковывается всё что нужно, и прям там же выполняется сборка.

SD>И я не говорил про нехватку памяти до свопа. Даже без этого — дисковое кэширование куда эффективнее при наличии большого количества свободной памяти.


А я специально говорил про любое I/O, а не только swap, в том числе и то I/O которое от нехватки памяти под дисковый кэш. Даже сборку больших проектов нетрудно полностью уместить в современные объёмы RAM.
Re: палко-часы и цп или поджарить попугаев
От: _ilya_  
Дата: 27.05.15 10:57
Оценка:
Здравствуйте, мыщъх, Вы писали:

М>желание иметь компьютер, который можно разместить в корпусе сервера, выдранного с мясом из рэка. хотя это не принципиально.


М>в игры играть мне не надо. мне надо компилировать и запускать много виртуальных машин одновременно.

М>скажите, топовый процессор у которого 24,601 попугаев действительно быстрее процессора у которого всего лишь ~8,000 попугаев

М> или разница нивелируется вводом-ввыводом? кстати, о вводе-выводе.


М>дальше еще вопрос про материнские платы. какие из них есть и чем отличаются. что-то давно не следил за новостями и отстал от жизни. какая сейчас самая быстрая память и сколько там каналов чтобы было в паре. и влияет ли оно на производительность если у процессора много попугаев и емкий кэш?


Рековые сильно шумные — ибо на шум в серверной пофиг, себе домой я бы такой не брал. Мощная рабочая станция в обычном корпусе — то что надо!
Разница в скорости будет на порядки!!! Ибо лезет 2 проца, и процы могут быть аж 18 ядерные! Но это дорого.
SSD стоят копейки если не требуется много-много террабайт. Ставить однозначно SSD.

Можно либо взять конструктор — платформа, куда сам засунешь какие хочешь процы, сколько надо памяти и ssd. Пример —
http://www.amazon.com/SuperWorkstation-7038A-I-Barebone-System-Mid-tower/dp/B00O1AJJ5C/ref=sr_1_1?s=pc&ie=UTF8&qid=1432724143&sr=1-1&keywords=SuperWorkstation+7038A-I

Либо сразу рабочую станцию в сборе — http://www.amazon.com/s/ref=nb_sb_noss?url=search-alias%3Dcomputers&field-keywords=workstation%2BXeon%2BE5%2Bv3

Процы — http://ark.intel.com/products/family/78583/Intel-Xeon-Processor-E5-v3-Family#@All

Тесты — http://www.thg.ru/cpu/obzor_intel_xeon_e5_2600_v3/obzor_intel_xeon_e5_2600_v3-03.html
Компиляция по идее настолько же процессор жрущая штука как архивирование. Протестируй свой проц и сравни
Отредактировано 27.05.2015 11:43 _ilya_ . Предыдущая версия . Еще …
Отредактировано 27.05.2015 11:18 _ilya_ . Предыдущая версия .
Re: палко-часы и цп или поджарить попугаев
От: akasoft Россия  
Дата: 29.05.15 12:09
Оценка:
Здравствуйте, мыщъх, Вы писали:

М>в игры играть мне не надо.


Даже ролевые не?

М> мне надо компилировать и запускать много виртуальных машин одновременно.


Для виртуалок твой показатель — ядра. Чем больше, тем больше виртуалок одновременно с минимальными потерями.

Компилирование сейчас тоже умеют распараллеливать, и это тоже ядра.
Старые компиляторы однопоточны, тот же P4 640 или C2D при частотах за 3 ГГц сумеют такие задачи уделать быстрее, но на современных многоядерках при этом будут работать и др. приложения и виртуалки.

М>скажите, топовый процессор у которого 24,601 попугаев действительно быстрее процессора у которого всего лишь ~8,000 попугаев как у меня сейчас на ноуте.


Попугаями мерять можно только удавов.

М>а что является? процессор? памяти если что с запасом.


Так запусти компиляцию и смотри производительность. Может статься, что разные этапы именно твоей компиляции грузят разные компоненты триады процессор-память-накопитель.

М> что-то давно не следил за новостями и отстал от жизни. какая сейчас самая быстрая память и сколько там каналов чтобы было в паре.


Быстрая DDR4 и сокет 2011-3. Представитель платформы — asus x99a.
... << RSDN@Home 1.2.0 alpha 5 rev. 66>>
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.