Хочу немного покопать в эту сторону для общего развития. Слышал про CUDA. Но оно вроде только для nvidia. Хотелось бы что-то, что и для nvidia и для ati. И очень желательно под .NET. Подскажите, куда копать, ссылки на полезные статьи. Хорошо, если будут простые примеры каких-нибудь параллельных вычислений.
Здравствуйте, Spiceman, Вы писали:
S>Хочу немного покопать в эту сторону для общего развития. Слышал про CUDA. Но оно вроде только для nvidia. Хотелось бы что-то, что и для nvidia и для ati. И очень желательно под .NET. Подскажите, куда копать, ссылки на полезные статьи. Хорошо, если будут простые примеры каких-нибудь параллельных вычислений.
См. OpenCL.
Открытый стандарт, поддерживаемый в т.ч. nVidia и AMD.
Здравствуйте, Spiceman, Вы писали:
S>Хочу немного покопать в эту сторону для общего развития. Слышал про CUDA. Но оно вроде только для nvidia. Хотелось бы что-то, что и для nvidia и для ati. И очень желательно под .NET. Подскажите, куда копать, ссылки на полезные статьи. Хорошо, если будут простые примеры каких-нибудь параллельных вычислений.
Казалось бы причем тут немерле... http://nuda.sourceforge.net/
... << RSDN@Home 1.2.0 alpha 4 rev. 1472>>
Пусть это будет просто:
просто, как только можно,
но не проще.
(C) А. Эйнштейн
Здравствуйте, WolfHound, Вы писали:
WH>Здравствуйте, Spiceman, Вы писали:
S>>Хочу немного покопать в эту сторону для общего развития. Слышал про CUDA. Но оно вроде только для nvidia. Хотелось бы что-то, что и для nvidia и для ati. И очень желательно под .NET. Подскажите, куда копать, ссылки на полезные статьи. Хорошо, если будут простые примеры каких-нибудь параллельных вычислений. WH>Казалось бы причем тут немерле... http://nuda.sourceforge.net/
Здравствуйте, peterbes, Вы писали:
WH>>Казалось бы причем тут немерле... http://nuda.sourceforge.net/
P>Так у них ничего нет.
На реальных задачах OpenCL все еще слишком уровневый. Опыт автора демонстирует это: он создал некоторый DSL над Cи-шным кодом OpenCL который позволяет выполнять некоторые оптимизации: вынос инвариантов, разворачивание циклов и т.д., при том код получается значительно короче чем аналог на Си и часто позволяет получать большую производительность. Т.е. смысл в том, что для достижения высокой (максимальной?) производиительности вычислений не достаточно написать код "под видяху" — нужно этот код еще долго и мучительно профилировать и оптимизировать.