BZ>ой. вот тебе для пример такой вопрос — есть char a[16] и b[16], нужно найти номер первого различающегося байта. какой ты предложишь подход?
хз, поксорить и посчитать clz не используя бранчи? вообще я не занимался низкоуровневой оптимизацией уже лет восемь, но вроде с того времени ничего не изменилось — если что-то векторизуется и нет branch missprediction то обычно всё упрётся в пропускную способность памяти