Войти в машинное обучение
От: Mihal9  
Дата: 12.01.23 16:20
Оценка:
Господа, помогите пожалуйста войти в машинное обучение.
Впечатленный последними достижениями в области нейросетей и машинного обучения (ChatGPT, Midjourney, AlphaZero и проч.), подумал, а не связать мне свою жизнь с машинным обучением?
Линейную алгебру, основы статистики, матанализ, матрицы более менее помню.

Python еще нужно изучать? Фреймворки вроде Pytorch?
Не совсем понимаю, что представляет собой сейчас Machine learning developer. Это тот, кто сам разрабатывает, или кто умело пользуется разработками компаний вроде OpenAI? Есть еще всякие Data analyst, Data scientist, Data Engineer

Где применимы эти знания? За машинным обучением будущее или хайп спадет? Что с вакансиями?
Re: Войти в машинное обучение
От: flаt  
Дата: 12.01.23 16:50
Оценка: 1 (1)
Из ABBYY звонили, предлагали обучаться по ходу работы. По деньгам тоже не обижали. Мне кажется, хороший вариант для вхождения в область.
Re[2]: Войти в машинное обучение
От: Mihal9  
Дата: 12.01.23 17:39
Оценка:
Здравствуйте, flаt, Вы писали:

F>Из ABBYY звонили, предлагали обучаться по ходу работы. По деньгам тоже не обижали. Мне кажется, хороший вариант для вхождения в область.


А чему обучаться предлагали?
Re[3]: Войти в машинное обучение
От: gyraboo  
Дата: 12.01.23 17:47
Оценка: 3 (1) +3 :))) :))) :))
Здравствуйте, Mihal9, Вы писали:

F>>Из ABBYY звонили, предлагали обучаться по ходу работы. По деньгам тоже не обижали. Мне кажется, хороший вариант для вхождения в область.


M>А чему обучаться предлагали?


На основе обезличенного массива собранных данных нужно быстро и дёшево найти инсайты к быстрому обогащению владельцев компании.
Re: Войти в машинное обучение
От: Pauel Беларусь http://blogs.rsdn.org/ikemefula
Дата: 12.01.23 17:54
Оценка:
Здравствуйте, Mihal9, Вы писали:

M>Господа, помогите пожалуйста войти в машинное обучение.


Машинное обучение нынче часть Data Science, стоит ширше глянуть, в чистом виде не такое уж и частое.
Re[2]: Войти в машинное обучение
От: Ночной Смотрящий Россия  
Дата: 13.01.23 08:15
Оценка: 1 (1)
Здравствуйте, flаt, Вы писали:

F>Из ABBYY звонили, предлагали обучаться по ходу работы. По деньгам тоже не обижали.


ABBYY больше нет в РФ. Готов к релокации?
... << RSDN@Home 1.3.17 alpha 5 rev. 62>>
Re: Войти в машинное обучение
От: namespace  
Дата: 13.01.23 09:00
Оценка:
M>Господа, помогите пожалуйста войти в машинное обучение.
Здесь это спрашивать бесполезно т.к. эта тема не программерская.

В этом "мышинном обучении" программирования еще меньше, чем в 1С, там основа — прикладная область и немного математики.
Есть известные пакеты этого "ИИ", их разработка — это мелкое допиливание и настройка.
В этой работе непосредственно кодирования(тем более проектирования) практически нет, основная — анализ данных(первичных, промежуточных, результата).

Основное место разработчика(если таковой требуется) в команде — написание софта по разметке данных "обучения".
Сама разметка — полу-ручная, с помощью того софта — довольно унылое занятие.
Re: Войти в машинное обучение
От: Nuzhny Россия https://github.com/Nuzhny007
Дата: 13.01.23 09:36
Оценка: 4 (4) +1
Здравствуйте, Mihal9, Вы писали:

M>Где применимы эти знания? За машинным обучением будущее или хайп спадет? Что с вакансиями?


Применимы в прикладных областях.
Большей частью работы будет работа с данными (поиск, автоматизация разметки, автоматизация контроля над разметкой, чистка, анализ). Чтение статей, копание в чужих разработках уже меньше. Написания кода скоро может вообще не быть в скором времени, потому что даже довольно сильные авторы новых архитектур выкладывают на гитхаб тот ещё говнокод.
Сейчас всё более чётко начитает область делиться на специализации: data scientist — редкая птица, обитает в крупных корпорациях и научных центрах, которые могут позволить себе железо для обучения нейросетей. Тут надо знать математику, английский, Питон, немного С++/CUDA приветствуется.
Data engineer — вот это уже да, найти данные, организовать их хранение, доступ, все дела. Тут уже SQL, облака, докеры, хранилища. Питон практически не нужен.
Machine learning engineer — надо в конкретной прикладной области взять то, что придумали data scientist'ы из крупных компаний, взять данные от data engineer и, написав тонкую прослойку на Питоне, подружить данные и модели.

Ну и программист, post Machine learning engineer (сам придумал). Я работаю примерно в этой роли. Питона касаюсь редко, но дообучить нейросеть могу. Читаю питоновский код, переписываю его на С++ (практически все фреймворки имеют С++ API). Занимаюсь низкоуровневой оптимизацией получения данных, подачи их на вход нейросети, могу на С++/CUDA что-то реализовать, если оно есть только в Питоне. Знаю классическое компьютерное зрение лучше всех предыдущих ролей. Инструменты, с одной стороны — чисто плюсовые библиотеки общего назначения, а с другой: TensorRT, OpenVINO, OpenCV, gstreamer, ffmpeg. Иногда могу ускорить питоновский прототип на Nvidia Jetson на порядок.

Отдельно стоит роль data analyst, которая не столько технивеская, сколько менеджерская, про разговоры с людьми, построение отчётов, графиков, визуализацию и представление данных, анализ работы систем/бизнеса и доведение человеческим языком того, что там происходит и как это можно оптимизировать.
Re: Войти в машинное обучение
От: paradok  
Дата: 13.01.23 11:46
Оценка:
Здравствуйте, Mihal9, Вы писали:


M> Что с вакансиями?


есть вакансии в ЧВК Вагнер — распознавание образов танков, пушек, самолетов и тд.
распознавание рельефа без GPS — все для ударных БПЛА

Это не шутка.
Re[2]: Войти в машинное обучение
От: Mihal9  
Дата: 13.01.23 14:20
Оценка:
Здравствуйте, Nuzhny, Вы писали:

Мне вот какой момент непонятен.
Какой смысл писать и тренировать своего чат-бота, если уже существует ChatGPT ?
С гигантами и крупными компаниями не посоревнуешься в качестве обучения нейросеток.

В чем тогда вообще смысл?
Re: Войти в машинное обучение
От: Sharov Россия  
Дата: 13.01.23 15:54
Оценка: 1 (1)
Здравствуйте, Mihal9, Вы писали:

В одс сегодня увидел -- https://www.interviewquery.com/p/data-science-job-market-disappearing
Кодом людям нужно помогать!
Re[3]: Войти в машинное обучение
От: SkyDance Земля  
Дата: 13.01.23 16:10
Оценка:
M>В чем тогда вообще смысл?

В том чтоб научиться (и заодно не допустить монополии).
Re[3]: Войти в машинное обучение
От: Nuzhny Россия https://github.com/Nuzhny007
Дата: 13.01.23 19:00
Оценка: +1
Здравствуйте, Mihal9, Вы писали:

M>Мне вот какой момент непонятен.

M>Какой смысл писать и тренировать своего чат-бота, если уже существует ChatGPT ?

Их адаптируют под свой домен, например. Доучивают, например, для банковского сектора. Но это не задача для одиночки.

M>С гигантами и крупными компаниями не посоревнуешься в качестве обучения нейросеток.


Почему нет?

M>В чем тогда вообще смысл?


Смысл чего именно?
Re[4]: Войти в машинное обучение
От: Mihal9  
Дата: 14.01.23 18:51
Оценка:
Здравствуйте, Nuzhny, Вы писали:


M>>С гигантами и крупными компаниями не посоревнуешься в качестве обучения нейросеток.


N>Почему нет?


Потому что с их железом они натренируют сеть за пару дней, в то время у нас уйдет пара месяцев
Re[5]: Войти в машинное обучение
От: Nuzhny Россия https://github.com/Nuzhny007
Дата: 15.01.23 04:22
Оценка:
Здравствуйте, Mihal9, Вы писали:

M>Потому что с их железом они натренируют сеть за пару дней, в то время у нас уйдет пара месяцев


Если ты про большие сети, то в домашнее железо они в принципе не влезут, поэтому без шансов. Обучение одной сети может стоить миллионы долларов, где-то видел такую оценку. Это если ты сможешь в точности повторить все условия и обучение сойдётся с первого раза.
Но есть и множество маленьких сеток, для которых хватает и игровых видеокарт. Люди собирают специализированные датасеты под конкретную предметную область, учат сетки, получают результат. Тут примерно как с софтом: свою ОС мало кто разрабатывает, но прикладной софт писать может любой.
Re[2]: Войти в машинное обучение
От: Буравчик Россия  
Дата: 15.01.23 10:45
Оценка:
Здравствуйте, Nuzhny, Вы писали:

N>Data engineer — вот это уже да, найти данные, организовать их хранение, доступ, все дела. Тут уже SQL, облака, докеры, хранилища. Питон практически не нужен.


Сюда еще ETL, DWH. Имхо, востребовано, и питон все-таки нужен
Best regards, Буравчик
Re[6]: Войти в машинное обучение
От: Mihal9  
Дата: 15.01.23 13:00
Оценка:
Здравствуйте, Nuzhny, Вы писали:

N>Если ты про большие сети, то в домашнее железо они в принципе не влезут, поэтому без шансов. Обучение одной сети может стоить миллионы долларов, где-то видел такую оценку. Это если ты сможешь в точности повторить все условия и обучение сойдётся с первого раза.

N>Но есть и множество маленьких сеток, для которых хватает и игровых видеокарт. Люди собирают специализированные датасеты под конкретную предметную область, учат сетки, получают результат.


Я понял вашу мысль. И всё равно: если Chat GPT усовершенствуют до уровня, когда он будет адекватно отвечать на любой вопрос, то пропадает необходимость писать свои чат-боты и тренировать свой домен (единственный и неповторимый).
Re[7]: Войти в машинное обучение
От: Nuzhny Россия https://github.com/Nuzhny007
Дата: 15.01.23 13:49
Оценка:
Здравствуйте, Mihal9, Вы писали:

M>Я понял вашу мысль. И всё равно: если Chat GPT усовершенствуют до уровня, когда он будет адекватно отвечать на любой вопрос, то пропадает необходимость писать свои чат-боты и тренировать свой домен (единственный и неповторимый).


Допустим, есть РЖД, для которого нужен чат-бот для справочной по билетам и перевозкам. Или Сбер со своими услугами. Ты уверен, что ChatGPT сможет из коробки консультировать пользователей по актуальным продуктам?
Re: Войти в машинное обучение
От: Mihal9  
Дата: 17.01.23 08:57
Оценка:
Еще мнения будут? Или где лучше спрашивать?

Нужно ли изучать Python, если хочу заняться машинным обучением?
Re[2]: Войти в машинное обучение
От: Nuzhny Россия https://github.com/Nuzhny007
Дата: 17.01.23 09:01
Оценка:
Здравствуйте, Mihal9, Вы писали:

M>Нужно ли изучать Python, если хочу заняться машинным обучением?


Разумеется. Посмотри вакансии, отсортируй требования по частоте встречаемости, начни изучение с вершины
Re[2]: Войти в машинное обучение
От: Sharov Россия  
Дата: 17.01.23 11:04
Оценка:
Здравствуйте, Mihal9, Вы писали:

M>Нужно ли изучать Python, если хочу заняться машинным обучением?


Да, однозначно. Я сейчас его изучаю. Но для ml там изучать особо нечего. Просто питон и помимо ml много где используется. Язык интересен и сам по себе.
Кодом людям нужно помогать!
Re: Войти в машинное обучение
От: DiPaolo Россия  
Дата: 17.01.23 11:23
Оценка:
Вот статья, которая расставляет по полочкам индустрию ML — https://vas3k.ru/blog/machine_learning/. Она написана в 2018, но более-менее актуально и сейчас.

Ко всему прочему, что советовали выше, добавлю:
— питон нужен, он в любом случае много где полезен
— начни просто с какой-то придуманной задачки для себя и начинай погружаться в тему. Ну, условно, натренируй сетку для распознавания цветов (растений). Это сразу потребует кучи вспомогательных действий: надо где-то достать кучу фоток -> надо распарсить какой-то сайт -> надо на питоне написать утилиту по парсингу сайта и выкачиванию картинок -> надо куда-то положить это в БД; потом надо сделать из этого датасет — опять питон и какая-то либа. Потом нужно их все привести к одному разрешению и что-то еще сделать — вот тебе и PIL пригодился (либа для работы с изображениями). Потом обучишь и поймешь, что обучилась плохо. Пойдешь изучишь тему балансировки датасета — тоже применишь и реализуешь такое. Ну и так далее. Потом поймешь, что нужно к этому веб-морду прикрутить или какой-то АПИ. Заюзаешь FastAPI + базу прикрутишь. Потом захочешь сам че-нить оптимизнуть, чтобы это на мобилках работало. Ну и так далее...

Ну и походу будет понятно: что более интересно, какая область применения ML, что вообще там есть (а там реально очень много всего вспомогательного вокруг).
Патриот здравого смысла
Re[8]: Войти в машинное обучение
От: C0x  
Дата: 25.01.23 15:08
Оценка:
Здравствуйте, Nuzhny, Вы писали:


N>Допустим, есть РЖД, для которого нужен чат-бот для справочной по билетам и перевозкам. Или Сбер со своими услугами. Ты уверен, что ChatGPT сможет из коробки консультировать пользователей по актуальным продуктам?


openai дает API для дообучения существующей модели под свои нужны. Это на порядки проще чем свое обучать с нуля.
Re[9]: Войти в машинное обучение
От: Nuzhny Россия https://github.com/Nuzhny007
Дата: 25.01.23 15:12
Оценка:
Здравствуйте, C0x, Вы писали:

N>>Допустим, есть РЖД, для которого нужен чат-бот для справочной по билетам и перевозкам. Или Сбер со своими услугами. Ты уверен, что ChatGPT сможет из коробки консультировать пользователей по актуальным продуктам?

C0x>openai дает API для дообучения существующей модели под свои нужны. Это на порядки проще чем свое обучать с нуля.

Я и не спорю,а наоборот говорю, что под свой домен всё равно надо будет тренировать. Сейчас и более простые сети всё чаще берут уже не голые, а с претрейном на имэйджнете.
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.