Здравствуйте, Тёмчик, Вы писали:
Тё>Но у тебя же профиль по компьютерному зрению. Разве ты не воспроизвёл известное, что делал за день до этого на основной работе?
Нет, лицами и жестами никогда не занимался. Но тут даже поинт был не в том, чтобы технические детали рассказать, а втом, чтобы сообразить в принципе: возможно ли сделать автоматическое восстановление профилей и как. Читал про их подход? Мало того, чтобы ты показал свою фотку — это может сделать любой. Мало того, чтобы ты загрузил видео — это тоже не сложно. Тут тебе в реальном времени дают жест, который надо сразу же повторить, при этом распознать тебя, распознать жест. Для этого надо знать, может ли технология в данный момент устойчиво распознавать жесты, как это делается. Знать как устроены системы распознавания лиц. Ну и всё такое сопутствующее. То есть это продукт своего времени, который, скажем, 5 лет назад появиться в принцие не мог. И 3 года назад тоже.
Тё>А в чём заключается компетенция тогда- если всё, что делает пользователь- прикручивает сторонний компонент (обученную ann)?
Там всё больше работа с датасетами, обучением, разметкой, автоматизацией, валидацией, очисткой и т.д. Тонкости есть, но не требующие уж очень глубоких знаний. Devops нейросетей, если можно так сказать. Но в то же время проблемы возникают: как поддерживать нейросеть в актуальном состоянии? Постоянно приходят новые данные, какие из них надо брать в тестовую выборку, а какие нет? Как обновлять нейросети на конечных устройствах (это про федеративное обучение)? Можно ли дообучать сеть на месте по подсказкам пользователя? Что делать, если появляется новый класс, представленный очень малой выборкой? Тесла в одной своей презентации рассказывала про то, как непросто отличить велосипедиста от велосипеда, прикрученного сзади к багажнику.
Также могут быть проблемы с вычислительными мощностями. Например, новую архитектуру для своей EfficientNet Google придумал силами auto ml, то есть на куче TPU очень долгое время архитектура синтезировалась автоматически. Небольшие конторы в принцие не обладают мощностями для таких штук. Зато теперь можно взять эту новую гугловскую сетку и дообучить под себя за сравнительно небольшое время на мощностях в тысячу раз меньших.