WH>>1)Я конечно в разработки процессоров мало что понимаю но что-то мне подсказывает что уменьшение длинны конвейера (а именно это произойдет при выкидывании нашлепки) скажется на производительности в лучшую сторону.
G>Глубина конвейера не сократится. Декодер команд ты никуда не выкинешь — единственная разница будет в том, что декодер будет выплевывать одну трехадресную микрокоманду в конвейер вместо группы, как это происходит сейчас, и станет чуть-чуть меньше площадью — от туда уйдут конечные автоматы, реализующие трансляцию x86 в трехадресный микрокод.
Глубина конвейера сократится.
Декодирование команды в современных x86 делается в пять этапов, что ли. Больше трёх, это точно.
G>Учитывая возросший размер исполняемого кода, и, как следствие — требования к пропускной способности памяти и размеру кэшей, после твоей модификации для выполнения той же работы (CISC-код заметно компактнее, чем RISC — я наблюдал до 2-х раз, сравни размеры бинарей для SPARC и x86), эффект будет отрицательным, а не положительным.
Beyond Architecture. Система команд load-store, длина команд варьируется. Декодирование делается в один такт. 30-40 процентов сокращения объёма кода.
http://www.beyondsemi.com/page/products/processor_cores