Здравствуйте, кубик, Вы писали:
К>Результаты сверял.
К>в c4_filter я заменил только главный цикл. Думаю этого достаточно.
Да, конечно.
К>Так как Xeon у меня старый, инетересно, как моя функа (она тоже наивная, переписана с твоей) посчитает на новых и посоревнуется с современным оптимизатором?
Отлично, ждём pull request.
К>Update: нашел gcc современный с -march=native и -mtune=native и -O2 так же как и VS 2008.
К>Он ничего не векторизировал в асме. Как я и ожидал. Если б так было б, то можно на пенсию было собираться.
Хм, странно.
Я вот тут вижу какую-то векторизацию внутреннего цикла:
https://godbolt.org/z/Gq6Gce