Здравствуйте.
Попробовал API-шную CreateThread()
Действительно, поток создается побыстрее (раза в два).
Для меня это конечно маловато

, но все-таки ...
И еще... По моим примерным прикидкам создание потока занимает столько же времени, сколько цикл до ~1000 с десятком операторов умножения в теле цикла. Очень печально ...
С уважением
Андрей