Интересная статья про эту специальность. Для меня сюрпризом была такая высокая востребованность R, думал, что это больше академический, а не практический язык.
О, ещё интересный факт для любителей C# — его вообще нет среди необходимых навыков. В отличие от "мёртвого трупа страуса", который аж на 18% потянул. Java и Scala присутствуют нормально.
Здравствуйте, Nuzhny, Вы писали:
N>Интересная статья про эту специальность. Для меня сюрпризом была такая высокая востребованность R, думал, что это больше академический, а не практический язык.
N>О, ещё интересный факт для любителей C# — его вообще нет среди необходимых навыков. В отличие от "мёртвого трупа страуса", который аж на 18% потянул. Java и Scala присутствуют нормально.
Ссылка не открывается. C# скоро поднимится — после выхода .net core у него теперь хорошие перспективы. Все работает, быстро и качественно. Самые лучшие и адекватные программисты. Одним словом идеальное сочетание.
N>О, ещё интересный факт для любителей C# — его вообще нет среди необходимых навыков. В отличие от "мёртвого трупа страуса", который аж на 18% потянул. Java и Scala присутствуют нормально.
Здравствуйте, Gattaka, Вы писали:
G>Ссылка не открывается. C# скоро поднимится — после выхода .net core у него теперь хорошие перспективы. Все работает, быстро и качественно. Самые лучшие и адекватные программисты. Одним словом идеальное сочетание.
Странно, держи ссылку на оригинал.
Куда он поднимется-то? У .net core есть возможности в статистике? В ML? В обработке больших данных? По этим дисциплинам проводятся курсы и обучение? Что он вообще может предложить?
N>Куда он поднимется-то? У .net core есть возможности в статистике? В ML? В обработке больших данных? По этим дисциплинам проводятся курсы и обучение? Что он вообще может предложить?
Здравствуйте, Nuzhny, Вы писали:
N>Интересная статья про эту специальность. Для меня сюрпризом была такая высокая востребованность R, думал, что это больше академический, а не практический язык.
N>О, ещё интересный факт для любителей C# — его вообще нет среди необходимых навыков. В отличие от "мёртвого трупа страуса", который аж на 18% потянул. Java и Scala присутствуют нормально.
По моим нисколько не обширным наблюдениям, про "труп страуса" кванты говорят, но в реале используют R и подобные языки. У Java вполне логично есть там ниша, ибо гугл выкладывает фреймворки на ней.
G>Ссылка не открывается. C# скоро поднимится — после выхода .net core у него теперь хорошие перспективы.
Только вот какое отношение core имеет к data science? Думаю, что у C# в этой области нет вообще никаких перспектив. Слишком он неудобен для работы с данными как язык (даже древнейший SAS удобнее не говоря про Python + pandas), а библиотеки слабые и развития их никакого в этом направлении не будет.
Здравствуйте, Gattaka, Вы писали:
G>Ссылка не открывается. C# скоро поднимится — после выхода .net core у него теперь хорошие перспективы. Все работает, быстро и качественно. Самые лучшие и адекватные программисты. Одним словом идеальное сочетание.
Java/Scala — в продакшн инфрастуктуре, спарк и все это, ну и Scala — скриптовый язык удобный для рисерча,
R и Python применительно к датасаенсу учатся не более чем за месяц, удобный инструментарий для работы с матрицами, векторами, статистикой и матаном, библиотеки по автоподбору фич и параметров моделей
R, вероятно, популярен потому, что его дают в вузах (но тех, кто знаю, на питон переходят)
Роль C# на практике — обмазка вокруг lightgbm для продакшна.
То есть дата саентист делает ресерч, подбирает фичи и параметры модели и делает это на питоне.
Потом годная модель отдается программистам, которые реализуют к этому интерфейс для человеков и прочего и тут уже есть c# но нет датасаенса
То есть проблемы C# он не скриптовый и под него все плохо с библиотеками
M>>То есть проблемы C# он не скриптовый и под него все плохо с библиотеками M>можно расшифровать это?
C# из-за статической типизации, тяжеловесности конструкций и т.д. не подходит для "интерактивной разработки"/REPL (типа как jupyter notebook для Python), а без этого работать с данными и их анализировать очень неудобно.
С библиотеками для data science у него не то чтобы всё плохо. Их просто практически нет.
N>Странно, держи ссылку на оригинал. N>Куда он поднимется-то? У .net core есть возможности в статистике? В ML? В обработке больших данных? По этим дисциплинам проводятся курсы и обучение? Что он вообще может предложить?
не, ну какая разница на чем писать джобы для хадупа, не, ну разница есть, питон или скала лучше, но можно и на .net хотя это как лечить кариес через попу. ТОесть пишен на .net сервис, укпаковываем в какой нить docker контейнер и запускаем его на любом linux environment
Здравствуйте, Тёмчик, Вы писали:
Тё>По моим нисколько не обширным наблюдениям, про "труп страуса" кванты говорят, но в реале используют R и подобные языки. У Java вполне логично есть там ниша, ибо гугл выкладывает фреймворки на ней.
Кванты-то ладно, их по статистике 8-20% из всех data scientist. Если же приложение сильно критично по времени, то всё равно от С++ пока не уйти. У нас разработка выглядит примерно так:
1. Модели пишутся на Python + Keras или чистый TF. Ну или другие более классически модели. На серверах всегда Убунта, на компах разработчиков (data scientist'ов конечно!) чаще всего тоже она.
2. Потом модели переносятся в продакшен уже на С++, inference нейросетей работает на opencv_dnn (если CPU) и на TF + cudnn (если GPU). Для TF используется его С++ API. Для всех моделей есть С++ API, мы их вызываем иногда сотни раз на один кадр видео, поэтому тут вариантов нет.
Наши data scientist'ы умеют писать и на С++, и на Питоне.
Жаль, что мир стал забывать годнейшую "APL–family". J, K, Q, kdb+, вот это все. Лучшие же ж инструменты для ворочания данными в плане скорости прототипирования подготовленным человеком.
Думаю, в первых рядах причин такого безобразия — уход в глухую проприетарщину и "камерность" соответствующих инструментов в свое время.
Здравствуйте, De-Bill, Вы писали:
DB>Слишком он неудобен для работы с данными как язык (даже древнейший SAS удобнее не говоря про Python + pandas), а библиотеки слабые и развития их никакого в этом направлении не будет.
Язык-то тут причем? Чет R в этом плане лучше? Вот библиотеки, а особенно встроенные -- это да, ресурс.
S>Язык-то тут причем? Чет R в этом плане лучше? Вот библиотеки, а особенно встроенные -- это да, ресурс.
Язык крайне важен. В data science большая большая часть идей, гипотез, подходов не срабатывает, или срабатывает не в том виде, в каком задумывалось. Допустим, мне надо проверить гипотезу. Я могу сделать это в 3 строки на Python, беру и делаю. На C# это заняло бы строк 20-30 со всякими вложенными циклами и подобной хренью, желание проверять гипотезу, которая в 90% случаев окажется неверной, пропадает.
Здравствуйте, De-Bill, Вы писали:
S>>Язык-то тут причем? Чет R в этом плане лучше? Вот библиотеки, а особенно встроенные -- это да, ресурс. DB>Язык крайне важен.
библиотеки и инструментарий важнее языка
скала взлетела потому что спарк
аналогичный F# не видно и не слышно
Здравствуйте, Nuzhny, Вы писали:
N>Для меня сюрпризом была такая высокая востребованность R, думал, что это больше академический, а не практический язык.
На фоне конкуренции R и Питона TensorFlow переходит на... swift! А это интрига.
Кстати, статья интересная, подробно описываются все доводы за и против выбора, есть анализ языков-кандидатов.