Здравствуйте, netch80, Вы писали:
N>Очевидно, ты в полемическом задоре даже не прочитал ссылку, на которую ссылаешься.
N>Ничего про предел fapb на ШК нет.
Боюсь, очевидно малость другое — ты пытаешься произносить вслух громкие вещи, смысла которых не понимаешь. ))
Для команд навроде fapb не требуется большего "предела", чем максимальная сбрасываемая длина конвейера вычислений, учитывая, что работает одновременно 4 конвейера, т.е. один основной и 3 альтернативных. Т.е., там, где у обычного проца происходит срыв конвейера при ошибке предсказания ветвления, у Эльбруса происходит переключение на один из конвейеров, работающий по альтернативной ветке, что резко уменьшает "сбрасываемую длину" конвейера, которая, собсно, и определяет необходимый размер внутренних буферов fapb.
Соответственно, у каждой модели Эльбруса кол-во этих регистров будет определяться характеристиками конвейера.
Перевожу на русский — вопрос был тупой донельзя.
N>В примере ассемблерного кода ни одной fapb.
Да я уже понял, что ты ни черта не понял.
N>По ссылке приводится пример математического расчёта. Почему-то все мерятели бенчмарками Эльбруса показывают только математику. Найди пример распаковки 7z-архива (один из типовых тестов, на которых сравнивают x86), перепаковки видео по ffmpeg. Какую-нибудь древнюю бегалку-стрелялку типа Doom (чтобы не требовался SSE и было достаточно типового оборудования лаптопа). Я подозреваю, что нет: им слабо́, потому что будут показаны результаты, с которыми стыдно идти даже к папуасам.
Свистишь как последний выскочка о всякой, прости хосподи, фигне.
В современном мире железо разрабатывается под софт, а софт под железо.
Ты же тут упорно делаешь вид, что подход должен быть сугубо односторонним.
С таким подходом пройдите, плиз, в детсад на смену подгузников.
Тут взрослые дядьки, всё-таки, общаются.