Здравствуйте, vdimas, Вы писали:
N>>Тут немножко поможет prefetch. Потому и бенчмарки для Эльбруса стараются показывать на потоковой обработке через SIMD, где это возможно. А на другом коде результаты сразу будут в разы хуже, чем у конкурентов с честным OoO: вечно что-то пропадает из кэша в самый интересный момент, и когда на OoO одна соответствующая команда тормозит, на EPIC тормозит вся группа.
V>Была сделана ставка на компилятор, что он сможет анализировать сценарии и грамотно раскидывать команды по VLIW.
Вот объясни мне, каким образом можно "грамотно раскидывать команды", когда при среднем времени выполнения, условно, 2 такта, каждая из них может получить непредсказуемую задержку до 200 тактов?