Data scientist job
От: Nuzhny Россия https://github.com/Nuzhny007
Дата: 26.04.18 18:32
Оценка: 4 (1) :)))
Интересная статья про эту специальность. Для меня сюрпризом была такая высокая востребованность R, думал, что это больше академический, а не практический язык.

О, ещё интересный факт для любителей C# — его вообще нет среди необходимых навыков. В отличие от "мёртвого трупа страуса", который аж на 18% потянул. Java и Scala присутствуют нормально.
Отредактировано 26.04.2018 18:44 Nuzhny . Предыдущая версия .
Re: Data scientist job
От: Gattaka Россия  
Дата: 26.04.18 20:23
Оценка: :))) :)))
Здравствуйте, Nuzhny, Вы писали:

N>Интересная статья про эту специальность. Для меня сюрпризом была такая высокая востребованность R, думал, что это больше академический, а не практический язык.


N>О, ещё интересный факт для любителей C# — его вообще нет среди необходимых навыков. В отличие от "мёртвого трупа страуса", который аж на 18% потянул. Java и Scala присутствуют нормально.

Ссылка не открывается. C# скоро поднимится — после выхода .net core у него теперь хорошие перспективы. Все работает, быстро и качественно. Самые лучшие и адекватные программисты. Одним словом идеальное сочетание.
Re: Data scientist job
От: turbocode  
Дата: 26.04.18 20:26
Оценка:
N>О, ещё интересный факт для любителей C# — его вообще нет среди необходимых навыков. В отличие от "мёртвого трупа страуса", который аж на 18% потянул. Java и Scala присутствуют нормально.

А где же XML\XSLT, NoSQL?
Re[2]: Data scientist job
От: Nuzhny Россия https://github.com/Nuzhny007
Дата: 26.04.18 21:00
Оценка: +1
Здравствуйте, Gattaka, Вы писали:

G>Ссылка не открывается. C# скоро поднимится — после выхода .net core у него теперь хорошие перспективы. Все работает, быстро и качественно. Самые лучшие и адекватные программисты. Одним словом идеальное сочетание.


Странно, держи ссылку на оригинал.
Куда он поднимется-то? У .net core есть возможности в статистике? В ML? В обработке больших данных? По этим дисциплинам проводятся курсы и обучение? Что он вообще может предложить?
Re[3]: Data scientist job
От: koenig  
Дата: 26.04.18 21:13
Оценка:
N>Куда он поднимется-то? У .net core есть возможности в статистике? В ML? В обработке больших данных? По этим дисциплинам проводятся курсы и обучение? Что он вообще может предложить?

да как обычно
ms найдет фатальный недостаток
Re[3]: Data scientist job
От: StatujaLeha на правах ИМХО
Дата: 26.04.18 22:24
Оценка:
Здравствуйте, Nuzhny, Вы писали:

N>Странно, держи ссылку на оригинал.


Роскомнадзор не спит.
Тоже оригинальная ссылка не открывалась. Через прокси все ок.
Re: Data scientist job
От: Тёмчик Австралия жж
Дата: 27.04.18 01:19
Оценка:
Здравствуйте, Nuzhny, Вы писали:

N>Интересная статья про эту специальность. Для меня сюрпризом была такая высокая востребованность R, думал, что это больше академический, а не практический язык.


N>О, ещё интересный факт для любителей C# — его вообще нет среди необходимых навыков. В отличие от "мёртвого трупа страуса", который аж на 18% потянул. Java и Scala присутствуют нормально.


По моим нисколько не обширным наблюдениям, про "труп страуса" кванты говорят, но в реале используют R и подобные языки. У Java вполне логично есть там ниша, ибо гугл выкладывает фреймворки на ней.
Re[2]: Data scientist job
От: De-Bill  
Дата: 27.04.18 01:26
Оценка: +1
G>Ссылка не открывается. C# скоро поднимится — после выхода .net core у него теперь хорошие перспективы.

Только вот какое отношение core имеет к data science? Думаю, что у C# в этой области нет вообще никаких перспектив. Слишком он неудобен для работы с данными как язык (даже древнейший SAS удобнее не говоря про Python + pandas), а библиотеки слабые и развития их никакого в этом направлении не будет.
Отредактировано 27.04.2018 1:30 De-Bill . Предыдущая версия .
Re: Data scientist job
От: De-Bill  
Дата: 27.04.18 01:38
Оценка: 4 (1)
N>Для меня сюрпризом была такая высокая востребованность R, думал, что это больше академический, а не практический язык.

Вот тоже интересная статья.
https://www.kdnuggets.com/2017/09/python-vs-r-data-science-machine-learning.html
R отстаёт от Python, и, думаю, разрыв будет нарастать.
Re[2]: Data scientist job
От: mtnl  
Дата: 27.04.18 03:32
Оценка: +1
Здравствуйте, Gattaka, Вы писали:

G>Ссылка не открывается. C# скоро поднимится — после выхода .net core у него теперь хорошие перспективы. Все работает, быстро и качественно. Самые лучшие и адекватные программисты. Одним словом идеальное сочетание.


Java/Scala — в продакшн инфрастуктуре, спарк и все это, ну и Scala — скриптовый язык удобный для рисерча,
R и Python применительно к датасаенсу учатся не более чем за месяц, удобный инструментарий для работы с матрицами, векторами, статистикой и матаном, библиотеки по автоподбору фич и параметров моделей
R, вероятно, популярен потому, что его дают в вузах (но тех, кто знаю, на питон переходят)

Роль C# на практике — обмазка вокруг lightgbm для продакшна.
То есть дата саентист делает ресерч, подбирает фичи и параметры модели и делает это на питоне.
Потом годная модель отдается программистам, которые реализуют к этому интерфейс для человеков и прочего и тут уже есть c# но нет датасаенса

То есть проблемы C# он не скриптовый и под него все плохо с библиотеками
Re[3]: Data scientist job
От: merge  
Дата: 27.04.18 05:41
Оценка:
Здравствуйте, mtnl, Вы писали:



M>То есть проблемы C# он не скриптовый и под него все плохо с библиотеками


можно расшифровать это?
Re[4]: Data scientist job
От: De-Bill  
Дата: 27.04.18 05:57
Оценка:
M>>То есть проблемы C# он не скриптовый и под него все плохо с библиотеками
M>можно расшифровать это?

C# из-за статической типизации, тяжеловесности конструкций и т.д. не подходит для "интерактивной разработки"/REPL (типа как jupyter notebook для Python), а без этого работать с данными и их анализировать очень неудобно.
С библиотеками для data science у него не то чтобы всё плохо. Их просто практически нет.
Re[3]: Data scientist job
От: snautSH Германия  
Дата: 27.04.18 07:36
Оценка:
N>Странно, держи ссылку на оригинал.
N>Куда он поднимется-то? У .net core есть возможности в статистике? В ML? В обработке больших данных? По этим дисциплинам проводятся курсы и обучение? Что он вообще может предложить?

не, ну какая разница на чем писать джобы для хадупа, не, ну разница есть, питон или скала лучше, но можно и на .net хотя это как лечить кариес через попу. ТОесть пишен на .net сервис, укпаковываем в какой нить docker контейнер и запускаем его на любом linux environment
Re[2]: Data scientist job
От: Nuzhny Россия https://github.com/Nuzhny007
Дата: 27.04.18 08:58
Оценка: +1
Здравствуйте, Тёмчик, Вы писали:

Тё>По моим нисколько не обширным наблюдениям, про "труп страуса" кванты говорят, но в реале используют R и подобные языки. У Java вполне логично есть там ниша, ибо гугл выкладывает фреймворки на ней.


Кванты-то ладно, их по статистике 8-20% из всех data scientist. Если же приложение сильно критично по времени, то всё равно от С++ пока не уйти. У нас разработка выглядит примерно так:
1. Модели пишутся на Python + Keras или чистый TF. Ну или другие более классически модели. На серверах всегда Убунта, на компах разработчиков (data scientist'ов конечно!) чаще всего тоже она.
2. Потом модели переносятся в продакшен уже на С++, inference нейросетей работает на opencv_dnn (если CPU) и на TF + cudnn (если GPU). Для TF используется его С++ API. Для всех моделей есть С++ API, мы их вызываем иногда сотни раз на один кадр видео, поэтому тут вариантов нет.

Наши data scientist'ы умеют писать и на С++, и на Питоне.
Re: Data scientist job
От: serj.e  
Дата: 27.04.18 09:20
Оценка: 4 (1) +1
Жаль, что мир стал забывать годнейшую "APL–family". J, K, Q, kdb+, вот это все. Лучшие же ж инструменты для ворочания данными в плане скорости прототипирования подготовленным человеком.

Думаю, в первых рядах причин такого безобразия — уход в глухую проприетарщину и "камерность" соответствующих инструментов в свое время.
Re[3]: Data scientist job
От: Sharov Россия  
Дата: 27.04.18 09:57
Оценка:
Здравствуйте, De-Bill, Вы писали:

DB>Слишком он неудобен для работы с данными как язык (даже древнейший SAS удобнее не говоря про Python + pandas), а библиотеки слабые и развития их никакого в этом направлении не будет.


Язык-то тут причем? Чет R в этом плане лучше? Вот библиотеки, а особенно встроенные -- это да, ресурс.
Кодом людям нужно помогать!
Re[4]: Data scientist job
От: De-Bill  
Дата: 27.04.18 10:05
Оценка:
S>Язык-то тут причем? Чет R в этом плане лучше? Вот библиотеки, а особенно встроенные -- это да, ресурс.

Язык крайне важен. В data science большая большая часть идей, гипотез, подходов не срабатывает, или срабатывает не в том виде, в каком задумывалось. Допустим, мне надо проверить гипотезу. Я могу сделать это в 3 строки на Python, беру и делаю. На C# это заняло бы строк 20-30 со всякими вложенными циклами и подобной хренью, желание проверять гипотезу, которая в 90% случаев окажется неверной, пропадает.
Re[5]: Data scientist job
От: torvic Голландия  
Дата: 27.04.18 10:14
Оценка:
Здравствуйте, De-Bill, Вы писали:

S>>Язык-то тут причем? Чет R в этом плане лучше? Вот библиотеки, а особенно встроенные -- это да, ресурс.

DB>Язык крайне важен.
библиотеки и инструментарий важнее языка
скала взлетела потому что спарк
аналогичный F# не видно и не слышно
Re: Data scientist job
От: Nuzhny Россия https://github.com/Nuzhny007
Дата: 27.04.18 10:15
Оценка:
Здравствуйте, Nuzhny, Вы писали:

N>Для меня сюрпризом была такая высокая востребованность R, думал, что это больше академический, а не практический язык.


На фоне конкуренции R и Питона TensorFlow переходит на... swift! А это интрига.
Кстати, статья интересная, подробно описываются все доводы за и против выбора, есть анализ языков-кандидатов.
Отредактировано 27.04.2018 10:32 Nuzhny . Предыдущая версия .
Re[6]: Data scientist job
От: De-Bill  
Дата: 27.04.18 10:39
Оценка:
T>библиотеки и инструментарий важнее языка

Важно и то и другое.
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.