Здравствуйте, koandrew, Вы писали:
J>>Крутая видеокарта не нужна, возможно, хватит даже встроенной. K>Очень многие действительно тяжёлые рассчёты в данное время имеют чёткую тенденцию уходить на GPGPU, так что я на вашем месте бы не зарекался. Если переход сделать правильно, можно получить до стократного ускорения.
На видеокарты для расчетов я давно посматриваю, но пока уж больно они дорогие, а имеющиеся объемы видеопамяти (в среднем 5 ГБ) не дадут решать какие-нибудь большие задачи. Кстати, если я ошибаюсь, то поправьте меня, ведь для того, чтобы был серьезный выигрыш от видеокарт, надо, чтобы вся задача умещалась в видеопамять?
Здравствуйте, Jenyay, Вы писали:
J>Я тоже грубо прикинул, и понял, что в выделенный бюджет двухпроцессорный сервак не уложится. Пока посматриваю на мать MSI Z87 MPOWER MAX, в которую можно воткнуть 64 ГБ памяти и проц i7 на сокете LGA 1150.
Если бюджет не тянется, то логично. Камень можно подобрать мощный, 64 Gb MSI-ки тянут. Планки памяти по 16 Gb пока дороговаты, но в указанный бюджет помещаются с запасом.
Здравствуйте, Jenyay, Вы писали:
J>На видеокарты для расчетов я давно посматриваю, но пока уж больно они дорогие, а имеющиеся объемы видеопамяти (в среднем 5 ГБ) не дадут решать какие-нибудь большие задачи. Кстати, если я ошибаюсь, то поправьте меня, ведь для того, чтобы был серьезный выигрыш от видеокарт, надо, чтобы вся задача умещалась в видеопамять?
Алгоритмы для GPU устроены не так, как для ЦП. "Большой" алгоритм разбивают на куски, и только данные данного куска должны быть в видеопамяти. При этом видеодрайвер сам позаботится об этом самостоятельно — ваша задача только подготовить данные и инициализировать ресурсы.
Здравствуйте, Jenyay, Вы писали:
J>32 — это нижний предел. В принципе, хотелось бы побольше. Если есть матери, которые поддерживают до 64 ГБ, то меня это устроило бы.
Здравствуйте, AndrewVK, Вы писали:
AVK>Здравствуйте, Jenyay, Вы писали:
J>>32 — это нижний предел. В принципе, хотелось бы побольше. Если есть матери, которые поддерживают до 64 ГБ, то меня это устроило бы.
AVK>Тысячи их. AVK>Для 2011 сокета — 8 планок по 8Гб.
Уточню. 64ГБ можно получить только с Xeon'ами, i7 не поддерживает больше 32ГБ.
Здравствуйте, Jenyay, Вы писали:
J>Я тоже грубо прикинул, и понял, что в выделенный бюджет двухпроцессорный сервак не уложится. Пока посматриваю на мать MSI Z87 MPOWER MAX, в которую можно воткнуть 64 ГБ памяти и проц i7 на сокете LGA 1150.
AVK>Да не особенно то Sandy и устарел, а через месяц будут Ivy.
Во многих вычислительных задачах 6 ядер сенди примерно равны 4 ядрам хасвелла. Когда через месяц будет Ivy, тогда посмотрим. Но, опять же, не думаю, что там будет значительный прыжок. Интел давно уже забила на повышение вычислительной мощности, упор сейчас идет в мобильность.
Здравствуйте, mik1, Вы писали:
MT>>Уточню. 64ГБ можно получить только с Xeon'ами, i7 не поддерживает больше 32ГБ.
M>А пацаны и не знали: M>Intel-Core-i7-3930K
Ограничивать потолком в 64Г и затачиваться на одно старое поколение процов несерьезно- тогда уж в 32 можно ужаться только за счет оптимизаций. Лучше сразу xeon воткнуть и не экономить на спичках. imho.
Здравствуйте, SkyDance, Вы писали:
SD>Во многих вычислительных задачах 6 ядер сенди примерно равны 4 ядрам хасвелла. Когда через месяц будет Ivy, тогда посмотрим. Но, опять же, не думаю, что там будет значительный прыжок. Интел давно уже забила на повышение вычислительной мощности, упор сейчас идет в мобильность.
Ты сам себе противоречишь. Либо забила, и тогда большой разницы между сенди и хасвелом быть не должно, либо не завила, тогда следует ожидать прироста производительности от новой линейки под 2011
... << RSDN@Home 1.2.0 alpha 5 rev. 100 on Windows 8 6.2.9200.0>>
Здравствуйте, SkyDance, Вы писали:
SD>Во многих вычислительных задачах 6 ядер сенди примерно равны 4 ядрам хасвелла. Когда через месяц будет Ivy, тогда посмотрим. Но, опять же, не думаю, что там будет значительный прыжок. Интел давно уже забила на повышение вычислительной мощности, упор сейчас идет в мобильность.
Кончай распространять свои заблуждения На нормально распараллеленых алгоритмах 6 ядер порвут 4 как тузик грелку.
Здравствуйте, Jenyay, Вы писали:
J>Здравствуйте, Ромашка, Вы писали:
Р>>Насколько хорошо эти вычисления параллелятся?
Р>>Если они независимы друг от друга, то может их лучше вообще на нескольких компах и/или GPU считать?
J>Сам алгоритм (FDTD) параллелится хорошо, но это одна задача, которой требуется много оперативки. С GPU пока связываться не хочется, потому что, чтобы от них была польза, вся задача должна помещаться в видеопамять. Типичная задача, которую сейчас решаем требует около 20 ГБ памяти.
По описанию алгоритма непонятно почему требуется обновременно столько памяти , расскажете ?
K>Кончай распространять свои заблуждения На нормально распараллеленых алгоритмах 6 ядер порвут 4 как тузик грелку.
Приводи примеры таких алгоритмов. Я могу точно сказать про видеокодирование — оно параллелится лучше некуда. И, если обратить внимание на 3930K vs 4770K в видеокодировании (например, в этом сравнении), разница составляет ажно 1%.
Если поискать всякие идеальные случаи, то в той же статье есть один тест, где 3930K таки быстрее, чем 4770, ажно на 10%. Это Java-машина. Но те, кто, как mik1, знают, с чем им приходится работать, знают и какое железо им требуется (как раз дофигаядерные xeon'ы с кучей памяти — жаба до всего жадная, от кэша до частот памяти).
Здравствуйте, SkyDance, Вы писали:
SD>Приводи примеры таких алгоритмов. Я могу точно сказать про видеокодирование — оно параллелится лучше некуда. И, если обратить внимание на 3930K vs 4770K в видеокодировании (например, в этом сравнении), разница составляет ажно 1%.
Обрати внимание на график
Не забывай, что речь идёт об алгоритме, который специально подгоняется под железо. В данном случае 6 ядер однозначно уделают 4, и спорить с этим просто глупо.
Обратил. И что? То, что ядра загружены (заметь, не на 100%), вообще ничего не означает.
K>Не забывай, что речь идёт об алгоритме, который специально подгоняется под железо. В данном случае 6 ядер однозначно уделают 4, и спорить с этим просто глупо.
6 ядер sandy vs 4 ядра haswell, не забывай. А то можно дойти до того, что 8 ядер в самсунге с4 будут круче 2х ядер у intel i3
Здравствуйте, SkyDance, Вы писали:
SD>Обратил. И что? То, что ядра загружены (заметь, не на 100%), вообще ничего не означает.
Вообще-то означает И загружаются они все на 100% — просто я кусок заскринил.
SD>6 ядер sandy vs 4 ядра haswell, не забывай. А то можно дойти до того, что 8 ядер в самсунге с4 будут круче 2х ядер у intel i3
Пофиг. Количество решает, ибо не так уж сильно различаются ядра, особенно на вычислениях с плавающей точкой. Уж точно не на 50%
K>Вообще-то означает И загружаются они все на 100% — просто я кусок заскринил.
Загрузка ядер на 100% означает только загрузку ядер на 100%, больше ничего. Может быть, они загружены spin lock'ом, синхронизируют что-то между собой.
K>Пофиг. Количество решает, ибо не так уж сильно различаются ядра, особенно на вычислениях с плавающей точкой. Уж точно не на 50%
Может, ты тогда объяснишь, почему результаты в медиакодировании одинаковы? Ведь параллелятся эти алгоритмы лучше некуда. И так — почти по всем тестам, даже тем, которые параллелятся хорошо.
Например, ты можешь неожиданно обнаружить, что 6 ядер будут работать на более низкой частоте (потому что 6 ядер греются больше, чем 4, а уж 6 ядер на 32 нм процессе греются заметноp больше 4х по 22 нм).
В общем, прогресс — это такая штука, которая делает флагманов 3х летней давности сравнимыми с нынешним середнячком. Тебя я хорошо понимаю, LGA2011 и процессоры под нее очень дорогие и тебе совсем не нравится, что обычный 4770 за 300 баксов (+200 на плату) нынче ничуть не медленнее твоей сборки, которая обошлась вчетверо дороже
Но на настоящий момент LGA2011 имеет смысл ровно в одной редкой ситуации: когда 32 Гб памяти мало, нужно 64, но 128 уже не нужно (т.е. Xeon'ы не нужны), при этом денег ровно столько, что на Xeon не хватает, но больше, чем нужно на i7 + 32 Gb.