Re[3]: Комп для расчетов - Железо

Здравствуйте, koandrew, Вы писали:

J>>Крутая видеокарта не нужна, возможно, хватит даже встроенной.
K>Очень многие действительно тяжёлые рассчёты в данное время имеют чёткую тенденцию уходить на GPGPU, так что я на вашем месте бы не зарекался. Если переход сделать правильно, можно получить до стократного ускорения.

На видеокарты для расчетов я давно посматриваю, но пока уж больно они дорогие, а имеющиеся объемы видеопамяти (в среднем 5 ГБ) не дадут решать какие-нибудь большие задачи. Кстати, если я ошибаюсь, то поправьте меня, ведь для того, чтобы был серьезный выигрыш от видеокарт, надо, чтобы вся задача умещалась в видеопамять?

Здравствуйте, Jenyay, Вы писали:

J>Я тоже грубо прикинул, и понял, что в выделенный бюджет двухпроцессорный сервак не уложится. Пока посматриваю на мать MSI Z87 MPOWER MAX, в которую можно воткнуть 64 ГБ памяти и проц i7 на сокете LGA 1150.

Если бюджет не тянется, то логично. Камень можно подобрать мощный, 64 Gb MSI-ки тянут. Планки памяти по 16 Gb пока дороговаты, но в указанный бюджет помещаются с запасом.

Здравствуйте, Jenyay, Вы писали:

J>На видеокарты для расчетов я давно посматриваю, но пока уж больно они дорогие, а имеющиеся объемы видеопамяти (в среднем 5 ГБ) не дадут решать какие-нибудь большие задачи. Кстати, если я ошибаюсь, то поправьте меня, ведь для того, чтобы был серьезный выигрыш от видеокарт, надо, чтобы вся задача умещалась в видеопамять?

Алгоритмы для GPU устроены не так, как для ЦП. "Большой" алгоритм разбивают на куски, и только данные данного куска должны быть в видеопамяти. При этом видеодрайвер сам позаботится об этом самостоятельно — ваша задача только подготовить данные и инициализировать ресурсы.

Здравствуйте, Jenyay, Вы писали:

J>32 — это нижний предел. В принципе, хотелось бы побольше. Если есть матери, которые поддерживают до 64 ГБ, то меня это устроило бы.

Тысячи их.
Для 2011 сокета — 8 планок по 8Гб.

... << RSDN@Home 1.2.0 alpha 5 rev. 100 on Windows 8 6.2.9200.0>>

Здравствуйте, SkyDance, Вы писали:

SD>Единственное, стоит отметить, что процессоры под LGA2011, мягко говоря, устарели

Да не особенно то Sandy и устарел, а через месяц будут Ivy.

... << RSDN@Home 1.2.0 alpha 5 rev. 100 on Windows 8 6.2.9200.0>>

Здравствуйте, AndrewVK, Вы писали:

AVK>Здравствуйте, Jenyay, Вы писали:

J>>32 — это нижний предел. В принципе, хотелось бы побольше. Если есть матери, которые поддерживают до 64 ГБ, то меня это устроило бы.

AVK>Тысячи их.
AVK>Для 2011 сокета — 8 планок по 8Гб.

Уточню. 64ГБ можно получить только с Xeon'ами, i7 не поддерживает больше 32ГБ.

AVK>Да не особенно то Sandy и устарел, а через месяц будут Ivy.

Во многих вычислительных задачах 6 ядер сенди примерно равны 4 ядрам хасвелла. Когда через месяц будет Ivy, тогда посмотрим. Но, опять же, не думаю, что там будет значительный прыжок. Интел давно уже забила на повышение вычислительной мощности, упор сейчас идет в мобильность.

Здравствуйте, MTimur, Вы писали:

MT>Уточню. 64ГБ можно получить только с Xeon'ами, i7 не поддерживает больше 32ГБ.

А пацаны и не знали:
Intel-Core-i7-3930K

Здравствуйте, mik1, Вы писали:

MT>>Уточню. 64ГБ можно получить только с Xeon'ами, i7 не поддерживает больше 32ГБ.

M>А пацаны и не знали:
M>Intel-Core-i7-3930K

Ограничивать потолком в 64Г и затачиваться на одно старое поколение процов несерьезно- тогда уж в 32 можно ужаться только за счет оптимизаций. Лучше сразу xeon воткнуть и не экономить на спичках. imho.

Здравствуйте, SkyDance, Вы писали:

SD>Во многих вычислительных задачах 6 ядер сенди примерно равны 4 ядрам хасвелла. Когда через месяц будет Ivy, тогда посмотрим. Но, опять же, не думаю, что там будет значительный прыжок. Интел давно уже забила на повышение вычислительной мощности, упор сейчас идет в мобильность.

Ты сам себе противоречишь. Либо забила, и тогда большой разницы между сенди и хасвелом быть не должно, либо не завила, тогда следует ожидать прироста производительности от новой линейки под 2011

... << RSDN@Home 1.2.0 alpha 5 rev. 100 on Windows 8 6.2.9200.0>>

J>Главное требование — памяти не меньше 32 ГБ, хотелось бы 64 ГБ. Бюджет — 100 тыс. р.

Если 64 ГБ, то могу предложить посмотреть здесь.
Например, X3 (подешевле) или Panther 5SE (подороже).

На нормально распараллеленых алгоритмах 6 ядер порвут 4 как тузик грелку.

Здравствуйте, MTimur, Вы писали:

MT>Уточню. 64ГБ можно получить только с Xeon'ами, i7 не поддерживает больше 32ГБ.

Неправда.

Здравствуйте, Jenyay, Вы писали:

J>Здравствуйте, Ромашка, Вы писали:

Р>>Насколько хорошо эти вычисления параллелятся?

Р>>Если они независимы друг от друга, то может их лучше вообще на нескольких компах и/или GPU считать?

J>Сам алгоритм (FDTD) параллелится хорошо, но это одна задача, которой требуется много оперативки. С GPU пока связываться не хочется, потому что, чтобы от них была польза, вся задача должна помещаться в видеопамять. Типичная задача, которую сейчас решаем требует около 20 ГБ памяти.

По описанию алгоритма непонятно почему требуется обновременно столько памяти , расскажете ?

... << RSDN@Home 1.2.0 alpha 5 rev. 1539>>

K>Кончай распространять свои заблуждения

На нормально распараллеленых алгоритмах 6 ядер порвут 4 как тузик грелку.

Приводи примеры таких алгоритмов. Я могу точно сказать про видеокодирование — оно параллелится лучше некуда. И, если обратить внимание на 3930K vs 4770K в видеокодировании (например, в этом сравнении), разница составляет ажно 1%.
Если поискать всякие идеальные случаи, то в той же статье есть один тест, где 3930K таки быстрее, чем 4770, ажно на 10%. Это Java-машина. Но те, кто, как mik1, знают, с чем им приходится работать, знают и какое железо им требуется (как раз дофигаядерные xeon'ы с кучей памяти — жаба до всего жадная, от кэша до частот памяти).

Здравствуйте, SkyDance, Вы писали:

SD>Приводи примеры таких алгоритмов. Я могу точно сказать про видеокодирование — оно параллелится лучше некуда. И, если обратить внимание на 3930K vs 4770K в видеокодировании (например, в этом сравнении), разница составляет ажно 1%.

http://www.rsdn.ru/forum/flame.comp/5217520.1 Обрати внимание на график

Не забывай, что речь идёт об алгоритме, который специально подгоняется под железо. В данном случае 6 ядер однозначно уделают 4, и спорить с этим просто глупо.

K>http://www.rsdn.ru/forum/flame.comp/5217520.1 Обрати внимание на график

Обратил. И что? То, что ядра загружены (заметь, не на 100%), вообще ничего не означает.

K>Не забывай, что речь идёт об алгоритме, который специально подгоняется под железо. В данном случае 6 ядер однозначно уделают 4, и спорить с этим просто глупо.

6 ядер sandy vs 4 ядра haswell, не забывай. А то можно дойти до того, что 8 ядер в самсунге с4 будут круче 2х ядер у intel i3

Здравствуйте, SkyDance, Вы писали:

SD>Обратил. И что? То, что ядра загружены (заметь, не на 100%), вообще ничего не означает.
Вообще-то означает

И загружаются они все на 100% — просто я кусок заскринил.

SD>6 ядер sandy vs 4 ядра haswell, не забывай. А то можно дойти до того, что 8 ядер в самсунге с4 будут круче 2х ядер у intel i3

Пофиг. Количество решает, ибо не так уж сильно различаются ядра, особенно на вычислениях с плавающей точкой. Уж точно не на 50%

K>Вообще-то означает

И загружаются они все на 100% — просто я кусок заскринил.

Загрузка ядер на 100% означает только загрузку ядер на 100%, больше ничего. Может быть, они загружены spin lock'ом, синхронизируют что-то между собой.

K>Пофиг. Количество решает, ибо не так уж сильно различаются ядра, особенно на вычислениях с плавающей точкой. Уж точно не на 50%

Может, ты тогда объяснишь, почему результаты в медиакодировании одинаковы? Ведь параллелятся эти алгоритмы лучше некуда. И так — почти по всем тестам, даже тем, которые параллелятся хорошо.
Например, ты можешь неожиданно обнаружить, что 6 ядер будут работать на более низкой частоте (потому что 6 ядер греются больше, чем 4, а уж 6 ядер на 32 нм процессе греются заметноp больше 4х по 22 нм).

В общем, прогресс — это такая штука, которая делает флагманов 3х летней давности сравнимыми с нынешним середнячком. Тебя я хорошо понимаю, LGA2011 и процессоры под нее очень дорогие и тебе совсем не нравится, что обычный 4770 за 300 баксов (+200 на плату) нынче ничуть не медленнее твоей сборки, которая обошлась вчетверо дороже

Но на настоящий момент LGA2011 имеет смысл ровно в одной редкой ситуации: когда 32 Гб памяти мало, нужно 64, но 128 уже не нужно (т.е. Xeon'ы не нужны), при этом денег ровно столько, что на Xeon не хватает, но больше, чем нужно на i7 + 32 Gb.

От:	Jenyay	http://jenyay.net
Дата:	16.08.13 05:23
Оценка:

От:	ShaggyOwl	http://www.rsdn.org
Дата:	16.08.13 05:42
Оценка:

От:	koandrew	http://thingselectronic.blogspot.ca/
Дата:	16.08.13 10:57
Оценка:

От:	AndrewVK	http://blogs.rsdn.org/avk
Дата:	16.08.13 23:33
Оценка:

От:	AndrewVK	http://blogs.rsdn.org/avk
Дата:	16.08.13 23:33
Оценка:

От:	ArtemGorikov	жж
Дата:	19.08.13 04:38
Оценка:

	От:	MTimur
	Дата:	18.08.13 11:33
	Оценка:	5 (1) -3

	От:	MTimur
	Дата:	18.08.13 11:48
	Оценка:

	От:	minorlogic
	Дата:	20.08.13 20:04
	Оценка:

	От:	SkyDance
	Дата:	20.08.13 23:51
	Оценка: