Сообщение Re: А кто-нибудь разбирается в GPGPU? от 25.09.2019 7:16
Изменено 25.09.2019 7:26 Muxa
Re: А кто-нибудь разбирается в GPGPU?
C>Стало интересно, насколько он всё же быстрее в реальных задачах.
Зависит от задачи.
C>Нашел статью с бенчмарком — сложение чисел в массиве. https://dournac.org/info/gpu_sum_reduction
Между замерами времени он запускает вычисления на GPU, копирует буфер (256 double значений) назад на CPU, досчитывает сумму.
Такая задача не будет сильно быстрее.
К тому же кернел он запустил всего один раз, а первый запуск содержит некоторый объем ленивой инициализации. В таких тестах я обычно первым делом запускаю пустой кернел в холостую.
Ну, и использование gettimeofday как вишенка.
ПС: шкала на графике логорифмическая
Зависит от задачи.
C>Нашел статью с бенчмарком — сложение чисел в массиве. https://dournac.org/info/gpu_sum_reduction
Между замерами времени он запускает вычисления на GPU, копирует буфер (256 double значений) назад на CPU, досчитывает сумму.
Такая задача не будет сильно быстрее.
К тому же кернел он запустил всего один раз, а первый запуск содержит некоторый объем ленивой инициализации. В таких тестах я обычно первым делом запускаю пустой кернел в холостую.
Ну, и использование gettimeofday как вишенка.
ПС: шкала на графике логорифмическая
Re: А кто-нибудь разбирается в GPGPU?
C>Стало интересно, насколько он всё же быстрее в реальных задачах.
Зависит от задачи.
C>Нашел статью с бенчмарком — сложение чисел в массиве. https://dournac.org/info/gpu_sum_reduction
Между замерами времени он запускает вычисления на GPU, копирует буфер (<= 2048 байт) назад на CPU через PCI шину, досчитывает сумму.
Такая задача не будет сильно быстрее.
К тому же кернел он запустил всего один раз, а первый запуск содержит некоторый объем ленивой инициализации. В таких тестах я обычно первым делом запускаю пустой кернел в холостую.
Ну, и использование gettimeofday как вишенка.
ПС: шкала на графике логорифмическая
Зависит от задачи.
C>Нашел статью с бенчмарком — сложение чисел в массиве. https://dournac.org/info/gpu_sum_reduction
Между замерами времени он запускает вычисления на GPU, копирует буфер (<= 2048 байт) назад на CPU через PCI шину, досчитывает сумму.
Такая задача не будет сильно быстрее.
К тому же кернел он запустил всего один раз, а первый запуск содержит некоторый объем ленивой инициализации. В таких тестах я обычно первым делом запускаю пустой кернел в холостую.
Ну, и использование gettimeofday как вишенка.
ПС: шкала на графике логорифмическая