Здравствуйте, WolfHound, Вы писали:
WH>Например укатывание алгоритма под кешь процессора. Ускорение от 2 до 100 раз.
Как это делается? Ммм, например, при какой-либо обработке изображения на 40 Мб. Разбивать её на блоки меньшие кэша и независимо их обрабатывать? А если независимо нельзя? Может, есть литература по теме?