Re[6]: решение проблем синхронизации
От: WolfHound  
Дата: 25.03.19 16:53
Оценка:
Здравствуйте, Nuzhny, Вы писали:

WH>>http://halide-lang.org/

N>А тут сё больше вопросов.
N>Гугл пробовал использовать Halide для оптимизации в TensorFlow, потом удалил.
N>Разработчики OpenCV (это сотрудники Intel) начали его использовать для своего dnn модуля, но тоже получилось так, что для Intel CPU код на С++ работает быстрее в 1.5 раза, для Intel iGPU быстрее работает OpenCL. А если использовать OpenVINO в качестве бэкенда, то будет ещё быстрее.
1)Откуда дрова?
2)Описываемые сценарии выглядят как оптимизация одной простой функции, на которую ни каких ресурсов не жалко.
Если же у тебя сотни сложных функций которые должны быстро работать на нескольких разных железках то ситуация резко меняется.
3)Если не halide то что? Возможно у него не самая лучшая реализация. Но я, честно говоря, не вижу вычислительную модель, которая лучше подходит для таких задач.

N>Кажется, что самописный код сейчас всё ещё быстрее, чем этот DSL.

Ни один ДСЛ не может ничего такого чего нельзя написать руками используя низкоуровневые примитивы. Так что руками всегда можно получить как минимум тот же результат. Вопрос в объёме работы.
... << RSDN@Home 1.0.0 alpha 5 rev. 0>>
Пусть это будет просто:
просто, как только можно,
но не проще.
(C) А. Эйнштейн
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.