Здравствуйте, Tekk, Вы писали:
T>Подскажите, где можно почитать по этой теме? Какие основные идеи, в чем разница по сравнению с программированием CPU? Каковы ограничения кода, как устроена память и взаимодействие с хостом, где основные бутылочные горлышки?
Я несколько месяцев назад поставил себе CUDA, покурил примеры, нашёл русскоязычные статьи, сам написал простенькие программки. Узкие места неплохо показывает профайлер.
После реализовал свой детектор движения, тот ускорился в 4 раза. Причём больше всего времени занимает копирование кадров в видеопамять. На этом довольный спокоился.