Сообщение Re: А кто-нибудь разбирается в GPGPU? от 25.09.2019 6:39
Изменено 25.09.2019 6:41 Sharowarsheg
Re: А кто-нибудь разбирается в GPGPU?
Здравствуйте, Codealot, Вы писали:
C>Стало интересно, насколько он всё же быстрее в реальных задачах. Нашел статью с бенчмарком — сложение чисел в массиве. https://dournac.org/info/gpu_sum_reduction
C>Видеокарта (не из дешевых, на момент написания статьи) с трудом обгоняет однопоточную реализацию для процессора.
C>Кто-нибудь объясните, чего я не понимаю?
Я когда делал что-то такое, у меня получалось, что передача в память GPU дорого стоит.
Если уж ты туда засунул массив, то и крути его там внутри GPU. Тогда получается гораздо мощнее.
C>Стало интересно, насколько он всё же быстрее в реальных задачах. Нашел статью с бенчмарком — сложение чисел в массиве. https://dournac.org/info/gpu_sum_reduction
C>Видеокарта (не из дешевых, на момент написания статьи) с трудом обгоняет однопоточную реализацию для процессора.
C>Кто-нибудь объясните, чего я не понимаю?
Я когда делал что-то такое, у меня получалось, что передача в память GPU дорого стоит.
Если уж ты туда засунул массив, то и крути его там внутри GPU. Тогда получается гораздо мощнее.
Re: А кто-нибудь разбирается в GPGPU?
Здравствуйте, Codealot, Вы писали:
C>Стало интересно, насколько он всё же быстрее в реальных задачах. Нашел статью с бенчмарком — сложение чисел в массиве. https://dournac.org/info/gpu_sum_reduction
C>Видеокарта (не из дешевых, на момент написания статьи) с трудом обгоняет однопоточную реализацию для процессора.
C>Кто-нибудь объясните, чего я не понимаю?
Я когда делал что-то такое, у меня получалось, что передача в память GPU дорого стоит.
Если уж ты туда засунул массив, то и крути его там внутри GPU. Тогда получается гораздо мощнее.
Ну то есть, поиск максимума по массиву ограничен пропускной способностью памяти, а не процессора/процессоров. GPU не позволяет избавиться от этой зависимости.
C>Стало интересно, насколько он всё же быстрее в реальных задачах. Нашел статью с бенчмарком — сложение чисел в массиве. https://dournac.org/info/gpu_sum_reduction
C>Видеокарта (не из дешевых, на момент написания статьи) с трудом обгоняет однопоточную реализацию для процессора.
C>Кто-нибудь объясните, чего я не понимаю?
Я когда делал что-то такое, у меня получалось, что передача в память GPU дорого стоит.
Если уж ты туда засунул массив, то и крути его там внутри GPU. Тогда получается гораздо мощнее.
Ну то есть, поиск максимума по массиву ограничен пропускной способностью памяти, а не процессора/процессоров. GPU не позволяет избавиться от этой зависимости.