V>Если удастся форсированно задать число потоков в OpenMP-программе, то можно прикинуть простой/загрузку этих потоков и на одном процессоре. По крайней мере, для MPI мне удавалось получить адекватные оценки эффективности распараллеливания прямо на домашней машине. Вот только я не представляю, как заставить OpenMP "распоточиться" на одном камне.
Посмотрел доки. Число потоков задать можно, хотя директивами тут не обойтись:
omp_set_num_threads(5);

Тот, кто желает, но не делает, распространяет чуму.