Здравствуйте, BulatZiganshin, Вы писали:
_>>Только вот оно будет всего лишь процентов на 10 быстрее, т.е. данная правка к нашей проблеме отношения не имеет. BZ>не может быть — этот цикл в идеале должен прокручиваться за 4 такта cpu и ничего быстрее ты не получишь. ты размер картинки уменьшил?
Вот если уменьшить, то да, будем наблюдать полноценный эффект ускорения. Но зачем нам её уменьшать, когда примеры с гораздо большим объёмом данных (и другим алгоритмом) тоже демонстрируют полноценное ускорение?) Правильнее алгоритм доработать... Только вот тут без ассемблера уже проблематично.