новые команды - для лохов! - Низкоуровневое программирование

Очередной программист решил проверить выигрыш от использования новых команд AVX-2 и 256-разрядных регистров. Набросал простой и понятный тест и....
получил двукратное замедление по сравнению с "обычными" командами. Кстати, выигрыш от использования SSE2 тоже не впечатляет.

Несколько лет назад сам я тоже вычислительную процедурку перевел на SSE2 и не увидел НИКАКОГО ускорения. И это был уже не тест, а реальные вычисления.
Попытки объяснить все "промахами кэша" выглядят очень бледно. Разводилово все эти новые возможности.
Вот его результаты:

cycles____________ instructions
187,888,737 ___ 366,382,169___ C original
167,129,257 ___ 282,694,918___ SSE2
390,340,078 ___ 168,337,307___ AVX2

Текст оригинального сообщения:

https://groups.google.com/forum/#!topic/comp.lang.asm.x86/j7wBKVUOmfI

	От:	кт
	Дата:	15.11.16 09:21
	Оценка: