Здравствуйте, netch80, Вы писали:
N>Не из-за этого, а из-за своей изначальной инвалидности.
А инвалидность заключалась в том, что он исполнял х86ой код в 10 раз медленнее конкурентов.
Все остальные проблемы интел бы решил в течении пары лет.
N>Но остаётся вопрос принципиально разных архитектур (CPU vs. GPU) и оптимизаций под конкретное железо. А вот тут большая загвоздка — те, кто для конкуренции вылизывает даже 1%, не пойдут на тотальный AOT, потому что в нём всегда будет меньше гибкости. А таких достаточно много.
1)И все они сливают вот этой штуке
http://halide-lang.org/
Программист из adobe убил 3 месяца на оптимизацию фильтра. Авторы halide за один день написали реализацию, которая работает в 2 раза быстрее. Изменив несколько строк сделали реализацию, для ГПУ которая работает в 7 раз быстрее.
2)Если очень хочется, то код можно заточить под конкретный процессор.
Создаём библиотеку примитивов процессора. И учим ВМ для этого процессора транслировать эти примитивы в соответствующие машинные коды.
Можно даже научить ВМ прозрачно подменять референсную реализацию на реализацию для конкретного процессора.
Можно даже сделать так чтобы было доказательство эквивалентности референсной реализации и реализации под конкретный процессор.
... << RSDN@Home 1.0.0 alpha 5 rev. 0>>