Когда читаю такие статьи, становится грустно. Такие они крутые датасаентисты в Индии, а я — фальшивый wannabe. И статистику то они знают, и хадупы, и кодить умеют. Что делать простым программистам- идти на помоечку?
$>Когда читаю такие статьи, становится грустно. Такие они крутые датасаентисты в Индии, а я — фальшивый wannabe. И статистику то они знают, и хадупы, и кодить умеют. Что делать простым программистам- идти на помоечку?
$>https://www.analyticsindiamag.com/8-ways-to-spot-a-fake-data-scientist/
$>Когда читаю такие статьи, становится грустно.
Да, там все лажа, начиная с заголовка, нет там никакой науки, просто статистика.
И сама профессия статистика известна уже чёрт знает сколько столетий.
Более унылого занятия сложно придумать.
Здравствуйте, namespace, Вы писали:
N>Да, там все лажа, начиная с заголовка, нет там никакой науки, просто статистика.
Это неправда.
Известное: "Программист, который умеет в data science, круче, чем дата-сайентист, который умеет в программирование."
Статистик — это больше математик, а дата-сайентист должен больше умень программировать, чем в математику. Он вообщу должен быть более инженером, чем статистик. Именно поэтому Excel не является основным инструментом, а R проигрывает Питону.
N>И сама профессия статистика известна уже чёрт знает сколько столетий. N>Более унылого занятия сложно придумать.
Так дата-сайентист и не статистик. Он должен не столько смотреть что вообще есть, сколько находить закономерности в огромных массивах данных и автоматизировать построение моделей.
Здравствуйте, Nuzhny, Вы писали:
N>Здравствуйте, namespace, Вы писали:
N>>Да, там все лажа, начиная с заголовка, нет там никакой науки, просто статистика.
N>Это неправда. N>Известное: "Программист, который умеет в data science, круче, чем дата-сайентист, который умеет в программирование." N>Статистик — это больше математик, а дата-сайентист должен больше умень программировать, чем в математику. Он вообщу должен быть более инженером, чем статистик. Именно поэтому Excel не является основным инструментом, а R проигрывает Питону.
Хотя я и согласна с этим утверждением, но очень многие data scientist хотят именно работать с данными, а не писать код, чтобы их массажировать. По своему роду деятельности (я работаю Data Architect) знаю и очень часто вижу, что все ждут для анализа хорошие, чистые, собранные вместе и проверенные данные, а собирают их Data Engineers, автоматизируют Data Ops team, и проверяют на качество Data Analysts. Конечно, в стартапах это всё может делать один 10-рукий Шива — Data Scientist (поэтому в долине им иногда платят $200K + equity), но в устоявшихся компаниях это все будут разные люди, особенно когда количество данных идёт на террабайты.
N>Так дата-сайентист и не статистик. Он должен не столько смотреть что вообще есть, сколько находить закономерности в огромных массивах данных и автоматизировать построение моделей.
Это в теории. Потому что автоматизация моделей — это уже ML. На деле, data scientist исследует данные, строит и разрабатывает модели, часто "вручную" (R, SQL и пр.), даже не всегда Python. По крайней мере недавно работала на проекте и там был именно такой товарищ.
Здравствуйте, Nuzhny, Вы писали:
N>Здравствуйте, namespace, Вы писали:
N>>Да, там все лажа, начиная с заголовка, нет там никакой науки, просто статистика.
N>Известное: "Программист, который умеет в data science, круче, чем дата-сайентист, который умеет в программирование." N>Статистик — это больше математик, а дата-сайентист должен больше умень программировать, чем в математику. Он вообщу должен быть более инженером, чем статистик.
Здравствуйте, Milena, Вы писали:
N>>Известное: "Программист, который умеет в data science, круче, чем дата-сайентист, который умеет в программирование." N>>Статистик — это больше математик, а дата-сайентист должен больше умень программировать, чем в математику. Он вообщу должен быть более инженером, чем статистик.
M>Как раз на эту тему — Why a data scientist is NOT a data engineer: https://www.oreilly.com/ideas/why-a-data-scientist-is-not-a-data-engineer
Здравствуйте, Milena, Вы писали:
M>Это в теории. Потому что автоматизация моделей — это уже ML. На деле, data scientist исследует данные, строит и разрабатывает модели, часто "вручную" (R, SQL и пр.), даже не всегда Python. По крайней мере недавно работала на проекте и там был именно такой товарищ.
Да, тут сложно судить, потому что ярлык data science сейчас наклеивают на слишком широкую область, которая дифференцируется в плане должностей на всех этих data engineer, data analyst, непосредственно data scientist, а также ml engineer туда же. по продметным областям тоже всё широко и, зачастую, несвязанно: таблицы, временные ряды, NLP, аудио, картинки, видео... Открываешь вакансию по data science и не знаешь, что там ждёт: то ли таблицы, статистика и SQL, то ли распознавание объектов на видео (это вообще можно назвать computer vision engineer для продакшена или computer vision researcher для R&D подразделений). Всё смешалось, как у программистов в 90-х, которые тоже умели всё и их особо не различали между собой.
Здравствуйте, mmu, Вы писали:
mmu>Здравствуйте, $$, Вы писали:
mmu>$>https://www.analyticsindiamag.com/8-ways-to-spot-a-fake-data-scientist/
mmu>$>Когда читаю такие статьи, становится грустно. Такие они крутые датасаентисты в Индии, а я — фальшивый wannabe. И статистику то они знают, и хадупы, и кодить умеют. Что делать простым программистам- идти на помоечку?
$>Когда читаю такие статьи, становится грустно. Такие они крутые датасаентисты в Индии, а я — фальшивый wannabe. И статистику то они знают, и хадупы, и кодить умеют. Что делать простым программистам- идти на помоечку?
все это применимо к обычному инженеру. причем тут дата сайнс вообще? что вы опять страдаете?