Обзор профессии Data scientist: чем занимается дата сайентист, сколько зарабатывает в 2023 году, что нужно знать, чтобы работать

кто такой data scientist: чем занимается дата сайентист, сколько зарабатывает в 2023 году, что нужно знать, чтобы работать Профессии

В статье мы поговорим о Дата Сайентистах. Узнаем, чем они занимаются, какими бывают, что входит в их обязанности, а также расскажем о востребованности, перспективах, плюсах и минусах профессии.

Кто такой дата-сайентист и чем занимается

Data scientist — это специалист, который обрабатывает большие массивы данных, чтобы извлекать значимые инсайты — неожиданные выводы, найденные почти наугад в результате обработки бессистемной информации.

кто такой data scientist: чем занимается дата сайентист, сколько зарабатывает в 2023 году, что нужно знать, чтобы работать

Этим дата-сайентист отличается от аналитика больших данных: его работа включает в себя элемент творчества и эксперимента, а созданные аналитические модели уникальны. По сути, это эксперт по аналитике больших данных, который выдаёт выводы, способные повлиять на ход различных событий.

В отличие от аналитики больших данных, которая изучает прошлое и фокусируется на отслеживании динамики явлений и её причинах, data science прогнозирует будущее. Эксперт по аналитике данных создают компьютерные модели, которые умеют распознавать данные и находить в них закономерности, предсказывать вероятность событий и их последствия, рекомендовать оптимальные решения и оценивать потенциальный успех идеи или проекта.

Дата-сайентисты на основе больших данных предсказывают, как изменится спрос на товары и услуги, цены на нефть и ценные бумаги и другие факторы прибыли компании. Эти сведения помогают руководителям компаний принимать обоснованные бизнес-решения

Обработку больших данных можно разделить на 2 основных этапа.

Подготовка данных. Для начала данные нужно собрать, структурировать и исследовать. Так будет понятно, какими методами их обрабатывать, какого рода инсайты можно найти в этих данных и как они помогут решить прикладную задачу.

Разработка вычислительной модели. Затем исследователь данных разрабатывает математические модели и алгоритмы, которые подходят для этой задачи: он использует матанализ, статистическое моделирование, теорию вероятностей и технологии искусственного интеллекта.

кто такой data scientist: чем занимается дата сайентист, сколько зарабатывает в 2023 году, что нужно знать, чтобы работать

Название профессии на английском data scientist говорит о том, что эта профессия — исследовательская. Задачи дата-сайентиста выходят за пределы обработки данных для прикладных целей.

Он как учёный двигает науку о данных вперёд, ищет новые методы сбора и обработки данных, способы повышения точности расчётов и прогнозов и принципиально новые варианты применения данных

Вот примеры того, как data science применяется в разных отраслях:

  • e-commerce и стриминговые платформы — рекомендательные системы для пользователей,
  • здравоохранение — прогнозирование заболеваний и рекомендации по сохранению здоровья;
  • логистика — планирование маршрутов и распределение автомобилей;
  • финансы — оценка платёжеспособности при выдаче кредита и обнаружение мошенников;
  • промышленность — отслеживание состояния оборудования и датчиков производства,
  • недвижимость — поиск наиболее подходящих покупателю объектов.

кто такой data scientist: чем занимается дата сайентист, сколько зарабатывает в 2023 году, что нужно знать, чтобы работать

Список отраслей можно продолжать: дата-сайентистов ждут в индустрии развлечений, госуправлении, спорте и др. Поговорим о востребованности профессии в более точных цифрах.

То есть Data Science — то же самое, что и обычная бизнес-аналитика?

Нет, это не одно и то же. Основная разница заключается в результате. Data Scientist ищет в массивах данных связи и закономерности, которые позволят ему создать модель, предсказывающую результат, — то есть можно сказать, что Data Scientist работает на будущее.

Он использует программные алгоритмы и математическую статистику и решает поставленную задачу в первую очередь как техническую.

Бизнес-аналитик сосредоточен не столько на технической, программной стороне задачи, сколько на коммерческих показателях компании. Он работает со статистикой и может оценить, например, насколько эффективна была рекламная кампания, сколько было продаж в предыдущем месяце и так далее.

Вся эта информация может использоваться для улучшения бизнес-показателей компании. Если данных много и нужен какой-то прогноз или оценка, то для решения технической стороны этой задачи бизнес-аналитик может привлечь дата-сайентистов.

Поясним на примере. Допустим, программа анализирует финансовые операции клиента и рекомендует выдать ему кредит или отказать. То есть задача программы — оценить платёжеспособность клиента. Создание такого програмного алгоритма — работа дата-сайентиста.

кто такой data scientist: чем занимается дата сайентист, сколько зарабатывает в 2023 году, что нужно знать, чтобы работать

А бизнес-аналитик не занимается такими техническими задачами. Его не интересует работа с конкретным клиентом, но он может проанализировать всю статистику банка по кредитам, например, за последние три месяца — и рекомендовать банку сократить или увеличить объёмы кредитования. Это бизнес-задача: предлагаются действия, которые увеличат доходность банка либо снизят финансовые риски.

Работа бизнес-аналитика и дата-сайентиста нередко пересекается, просто каждый занимается своей частью задачи.

Требования к джуниору, мидлу и сеньору Data Scientist

Junior Data Scientist должен знать и иметь:

  1. Базовые знания машинного обучения и статистики. Понимание основных алгоритмов и области их применения.
  2. Опыт применения: не обязателен, максимум — учебный проект.
  3. Программирование: уверенный Python и базовое знание SQL.

Middle Data Scientist должен иметь:

  1. Глубокие знания математики.
  2. Опыт: 2–3 решённых проекта.
  3. Программирование: уверенный Python и знание его особенностей в плане продуктивизации моделей и оптимизации работы.
  4. Уверенные знания по культуре проведения экспериментов, работа с инструментами внедрения и поддержки моделей машинного обучения: gitLFS, MLFlow, DVC. Знание A/B-тестирования.
  5. Умение решать задачу от начала до конца с минимальным вмешательством старшего специалиста или тимлида.

Требования к Senior Data Scientist:

  1. Глубокие, уверенные знания математики и статистики.
  2. Опыт: от 5 решённых проектов.
  3. Программирование: уверенные Python, SQL.
  4. Экспертные знания в своей области.
  5. Полная самостоятельность от постановки задачи до вывода в продакшен.
  6. Способность обучать и менторить младших и продвинутых специалистов.

кто такой data scientist: чем занимается дата сайентист, сколько зарабатывает в 2023 году, что нужно знать, чтобы работать

Место работы

Специалисты по Data Science востребованы во многих направлениях: бизнес, производство, маркетинг, СМИ, IT, политика, наука, медицина и т. д.

Основные сферы, в которых чаще всего работают Дата Сайентисты:

  • Розничные, оптовые и интернет-продажи. В этих отраслях Data Scientist решает множество задач: прогноз спроса на товары с учетом сезонности, разработка персонализированных маркетинговых или рекламных предложений и т. д.
  • Банки, финансовые организации – для скоринговых систем, анализа рисков, расчета кредитных ставок, оценки платежеспособности заемщиков.
  • Транспортные, логистические центры – для построения оптимальных маршрутов, определения сроков доставки, планирования загрузки складов.
  • Информационные технологии – для разработки софта, веб- и мобильных приложений, например, ботов, поисковых систем, крупных маркетплейсов, соцсетей, онлайн-сервисов с контентом различного назначения.
  • Производственная сфера, сельское хозяйство – для прогнозирования объемов производства и потребления, возможных сбоев оборудования, дефекта продукции.
  • Высокотехнологичные отрасли, к примеру, создание искусственного интеллекта.

кто такой data scientist: чем занимается дата сайентист, сколько зарабатывает в 2023 году, что нужно знать, чтобы работать

Этапы карьеры в data science

Как правило, data scientist проходит несколько этапов карьерного роста:

  • Стажёр. На этой позиции можно работать после коротких курсов. Однако стажёры не очень востребованы (в декабре 2022 года на hh.ru около 30 вакансий, не требующих опыта). Новичкам стоит поискать возможность пройти практику в компаниях с опытными специалистами, чтобы быстрее изучить базу и перейти на новый уровень.
  • Начинающий специалист, который решает несложные задачи: подготавливает данные к обработке, ищет ошибки, строит таблицы.
  • Самостоятельно решает множество задач, разбирается в математике и программировании на Python, создаёт алгоритмы, проводит эксперименты.
  • Лидер команды — одновременно работает над несколькими крупными проектами, знает статистику и математику, умеет качественно визуализировать результаты, обучает младших специалистов.

Сколько зарабатывает Data Scientist

Как и везде, это зависит от опыта работы и навыков дата-сайентиста, особенностей компании и сложности конкретного проекта.

Но общий расклад примерно такой (данные приведены по состоянию на февраль 2020 года):

  • Зарплаты по вакансии Data Scientist на HH.ru начинаются от 70 тысяч рублей по России и от 100 тысяч рублей в Москве. Это деньги, на которые могут претендовать новички в отрасли. Чтобы было проще сориентироваться, средняя зарплата в Москве в начале 2020 года составляет около 86 тысяч рублей.
  • Основной диапазон зарплат по вакансиям дата-сайентиста — примерно от 100 до 160 тысяч рублей по России и от 150 до 200 тысяч рублей в Москве. На такие зарплаты могут претендовать специалисты с опытом.

кто такой data scientist: чем занимается дата сайентист, сколько зарабатывает в 2023 году, что нужно знать, чтобы работать

Высококвалифицированные специалисты по Data Science могут получать в месяц 250 тысяч рублей и более.

Как стать дата-сайентистом

Начать обучение следует с математического образования, затем или параллельно изучая программирование, методы обработки данных и машинного обучения.

Необходимую базу дают в вузах и вы можете стать дата-сай­ен­ти­стом после уни­вер­си­тета. Взрос­лым этот путь не всегда удобен, потому что начинать обучение нужно обязательно осенью, а сов­ме­щать очную учё­бу и работу сложно.

Но если вы сторонник академического образования и вам нужен диплом государственного образца, но мешает невозможность приехать в другой город — вам подойдёт программа дистанционного бакалавриата, подготовленная вместе с Российской академией народного хозяйства.

А с чего лучше начать?

Начать лучше с математики. Очень сложная математика не понадобится, но вы должны свободно ориентироваться в таких понятиях, как производная, дифференциал, определитель матрицы, и в том, что с ними связано. Освоить это вам помогут книги и лекционные курсы. Например, книга «Математический анализ» Липмана Берса, написанная довольно простым языком.

Где учиться на data scientist

Существуют краткосрочные курсы по работе с большими данными. Так, на платформе Synergy Academy программа длится шесть месяцев. Здесь учат понимать основы статистики, проектировать базы данных, программировать на Python, создавать и обучать модели, анализировать big data. Курс подходит даже новичкам и начинающим программистам.

кто такой data scientist: чем занимается дата сайентист, сколько зарабатывает в 2023 году, что нужно знать, чтобы работать

Высшее образование в сфере data science можно получить на факультете искусственного интеллекта в университете «Синергия». На программе бакалавриата студенты изучают программирование на Python, методы машинного обучения, теорию информации и кодирования, работу с большими данными и углублённый анализ данных, компьютерное зрение, алгоритмы и структуры данных.

После выпуска, как правило, учёба не оканчивается. Data scientist должен быть всегда в тренде. Эксперты советуют читать блог на Medium и статьи на arxiv.org: в них публикуют свежие новости из сферы data science и machine learning. Полезно вступить в сообщество аналитиков данных: больше 12 тысяч юзеров общаются в slack-чате ODS (Open Data Science) и делятся советами.

Составить представление о принципах профессии можно, прочитав книги:

  • «Data Science. Наука о данных с нуля» Джоэла Граса.
  • «Много цифр. Анализ больших данных при помощи Excel» Джона Формана (да, чтобы применять big data в своём бизнесе, даже не надо кодить).
  • Data Science for Business Фостера Провоста и Тома Фоусетта (на английском языке).
  • Data Smart Джона Формана (на английском языке).

кто такой data scientist: чем занимается дата сайентист, сколько зарабатывает в 2023 году, что нужно знать, чтобы работать

Коротко о главном

Облако цифровой информации, которое называют большими данными, постоянно растёт. Оно — источник инсайтов, которые могут помочь решить прикладные задачи. Обработкой таких данных занимаются дата-сайентисты.

Их услуги хорошо оплачиваются и нужны во всех отраслях: от сферы развлечений и спорта до здравоохранения и политики. Специалистов пока не хватает, а спрос стабильно растёт.

Если математический склад ума, склонность к анализу и прагматичность — это про вас, приходите в профессию будущего. Остальные необходимые навыки вы можете получить на онлайн-курсах, закрепить их на практике и наработать опыт уже во время учёбы.

кто такой data scientist: чем занимается дата сайентист, сколько зарабатывает в 2023 году, что нужно знать, чтобы работать

Заключение

Каждую секунду в мире генерируется и копится цифровая информация: о банковских транзакциях, политических новостях, кликах пользователей интернета, их поисковых запросах и перемещениях и др. Это бессистемное море информации можно превратить в источник полезных сведений, которые ниоткуда больше не добыть.

Как это сделать, знают специалисты науки о данных — дата-сайентисты (от английского data scientist). Кто это, что они делают, чтобы извлекать из больших данных полезные прикладные выводы и стоит ли становиться одним из них.

Оцените статью
ITkurs.info
Добавить комментарий