Профессия Data Scientist: обучение, плюсы и минусы, зарплата
Содержание
- 1 Определение
- 2 Пять главных терминов
- 3 Профессия
- 4 Что нужно знать
- 5 Технические навыки
- 6 Теория
- 7 Практика
- 8 Плюсы и минусы профессии
- 9 Риски
- 10 Эти прогнозы и правда полезны?
- 11 То же самое, что и обычная бизнес-аналитика?
- 12 Используется ли в вашей работе?
- 13 Как понять, что вашей компании нужен
- 14 Big Data
- 15 Машинное Обучение
- 16 Откуда прийти в профессию и куда расти
- 17 Вузы и курсы
- 17.1 1. A crash course in Data Science
- 17.2 2. Building a Data Science Team
- 17.3 3. The Data Scientist’s Toolbox
- 17.4 4. Stepic Contest. Data Science
- 17.5 5. Факультет искусственного интеллекта от GeekBrains
- 17.6 6. Факультет аналитики Big Data от GeekBrains
- 17.7 7. Полный курс по Data Science от SkillFactory
- 17.8 8. «Профессия Data Scientist» от Нетологии
- 17.9 Доход
- 18 Заключение
Определение
Data Science — это применение научных методов при работе с данными, чтобы найти нужное решение. В широком смысле, естественные науки основаны на Data Science. Например, биолог проводит эксперименты и анализирует результаты для проверки своих гипотез. Он должен уметь обобщать частные наблюдения, исключать случайности и делать верные выводы.
Датасаентист работает с данными так же, как ученый в любой другой сфере. Он использует математическую статистику, логические принципы и современные инструменты визуализации, чтобы получить результат.
Сбор данных — это способ измерить процессы вокруг нас. А научные методы позволяют расшифровать большие массивы данных, найти в них закономерности и применить для решения конкретной задачи.
Пять главных терминов
Искусственный интеллект, машинное обучение, глубокое обучение и наука о данных — основные и самые популярные термины. Они близки, но не эквивалентны друг другу. На старте важно разобраться, чем они отличаются.
Искусственный интеллект (Artificial Intelligence) — область, посвящённая созданию интеллектуальных систем, работающих и действующих как люди. Её возникновение связано с появлением машин Алана Тьюринга в 1936 году. Несмотря на долгую историю развития, искусственный интеллект пока не способен полностью заменить человека в большинстве областей. А конкуренция ИИ с людьми в шахматах и шифрование данных — две стороны одной медали.
Машинное обучение (Machine learning) — создание инструмента для извлечения знаний из данных. Модели ML обучаются на данных самостоятельно или поэтапно: обучение с учителем на подготовленных человеком данных и без учителя — работа со стихийными, зашумленными данными.
Глубокое обучение (Deep learning) — создание многослойных нейронных сетей в областях, где требуется более продвинутый или быстрый анализ и традиционное машинное обучение не справляется. «Глубина» обеспечивается некоторым количеством скрытых слоев нейронов в сети, которые проводят математические вычисления.
Большие данные (Big Data) — работа с большим объёмом часто неструктурированных данных. Специфика сферы — это инструменты и системы, способные выдерживать высокие нагрузки.
Наука об анализе данных (Data Science) — в основе области лежит наделение смыслом массивов данных, визуализация, сбор идей и принятие решений на основе этих данных. Специалисты по анализу данных используют некоторые методы машинного обучения и Big Data: облачные вычисления, инструменты для создания виртуальной среды разработки и многое другое.
Профессия
Дословно Data Scientist переводится как «ученый данных». Но деятельность у такого специалиста не научная, а практическая: он работает с данными компании, анализирует их, ищет зависимости, делает выводы на их основе и при необходимости строит визуализации. Для этого Data Scientist использует разные математические алгоритмы, специальное программное обеспечение и инструменты разработки.
Из более привычных специальностей Data Scientist ближе всего к программисту и бизнес-аналитику.
Данные, с которыми работает Data Scientist, могут быть любыми: звук, текст, фото, видео, таблицы, документы. Если у вас есть любые данные и нужно их проанализировать — это работа для Data Scientist.
В сфере данных работают и другие специалисты, например, Machine Learning Engineer, Data Engineer или Data Analyst. У них более узкая специализация, например, Machine Learning Engineer меньше занимается анализом данных, в основном разрабатывает модели машинного обучения. Data Scientist — более широкий термин, который обозначает человека с разными компетенциями в области анализа данных.
Обычно компании на старте нанимают одного Data Scientist. В будущем, если разноплановых задач, связанных с данными, станет слишком много, можно нанять несколько таких специалистов, то есть создать целый отдел Data Science.
Что нужно знать
У работодателей пока нет единых требований к таким кандидатам, набор навыков и инструментов зависит от задач конкретной компании. Можно выделить базовые требования для специалистов, которые работают с большим количеством данных:
- математика (статистика, теория вероятности, линейная алгебра и математический анализ), чтобы строить математические модели, искать закономерности или предсказывать что-то новое;
- программирование (языки программирования Python, R), чтобы написать модель для первоначальной оценки гипотезы, поиска общих данных или простой аналитики;
- машинное обучение, чтобы переобучать готовые или создавать собственные модели;
- инструменты анализа данных (библиотеки Pandas, Matplotlib).
Технические навыки
— Советую начинать именно с них, чтобы вы сразу ориентировались на практику, а не уходили в математическую теорию. Самый популярный язык программирования в DS — Python. По опросу Kaggle, который площадка проводила внутри своего сообщества специалистов по обработке данных и машинному обучению в 2018 году, 83% респондентов используют Python ежедневно. Поэтому в первую очередь изучите его, но немного внимания нужно будет уделить кое-каким другим языкам. Например, R.
Теория
По ходу изучения технических моментов вам неизбежно будет встречаться теория, которая стоит за кодом.
Призываю вас учить теорию без отрыва от практики.
Например, я изучаю код, чтобы научиться применять какую-то технику (скажем, метод k-средних, KMeans), а когда она сработает, начинаю глубже разбираться с понятиями, которые с ней связаны (например, с инертностью, Inertia).
- Все сопутствующие алгоритмам математические термины есть в той же документации scikit-learn.
- Ниже я перечислю главное, что нужно изучить из теории вместе с прикладными аспектами. Почти по всем этим вещам есть бесплатные уроки на khan academy. Во время регистрации или в профиле можно выбрать нужные вам дисциплины, и сайт выдаст пошаговый план по каждому предмету.
Практика
Теперь можно приступить к третьей части программы — практическому опыту. Чтобы отточить полученные скиллы, их нужно задействовать в проектах — желательно, чтобы они были похожи на какие-то уже существующие приложения. Попутно перед вами будут возникать разные сложности, но справляясь с ними, вы очень хорошо «прощупаете» предмет и прокачаете свои знания.
Андерс Эрикссон, «Максимум. Как достичь личного совершенства с помощью современных научных открытий»: «Чтобы научиться чему-то, чего вы не умели раньше, нужно постоянно выходить из состояния равновесия и заставлять мозг и тело адаптироваться к изменяющимся условиям».
Плюсы и минусы профессии
Плюсы
- Профессия не только чрезвычайно востребованная, но существует острый дефицит специалистов такого уровня. Поэтому так стремительно и широко финансируются и развиваются факультеты при самых престижных вузах по подготовке специалистов по данным. В России также растет спрос на Data Scientist.
- Высокооплачиваемая профессия.
- Необходимость постоянно развиваться, идти в ногу с развитием IT-технологий, самому создавать новые методы обработки, анализа и хранения данных.
Минусы
- Не каждый человек сможет освоить эту профессию, нужен особый склад ума.
- В процессе работы могут не сработать известные методы и более 60% идей. Множество решений окажется несостоятельным и нужно иметь большое терпение, чтобы получить удовлетворительные результаты. Учёный не имеет права сказать: «НЕТ!» проблеме. Он должен найти способ, который поможет решить поставленную задачу.
Риски
Традиционные риски Data Science проектов
- Высокая стоимость реализации проекта приведет к финансовым потерям (не окупится)
- Отсутствие подробной отчетности по проекту не позволит отчитаться о потраченных средствах или принять правильное решение о продолжении проекта
- Внедрение закрытого алгоритма или программы («Черный ящик») сделает невозможным дальнейшее изменение или модернизацию проекта внешними или внутренними ресурсами
Эти прогнозы и правда полезны?
Да. Очень многие сервисы, к которым мы уже привыкли, создали дата-сайентисты. И вы сталкиваетесь с результатами их работы каждый день. Например, это прогнозы погоды, чат-боты, голосовые помощники… А ещё — алгоритмы, рекомендующие музыку и видео под вкус конкретного пользователя. Список возможных друзей в социальных сетях — тоже результат Data Science. В основе поисковых систем и программ для распознавания лиц тоже лежат алгоритмы, написанные дата-сайентистами.
То же самое, что и обычная бизнес-аналитика?
Нет, это не одно и то же. Основная разница заключается в результате. Data Scientist ищет в массивах данных связи и закономерности, которые позволят ему создать модель, предсказывающую результат, — то есть можно сказать, что Data Scientist работает на будущее. Он использует программные алгоритмы и математическую статистику и решает поставленную задачу в первую очередь как техническую.
Бизнес-аналитик сосредоточен не столько на технической, программной стороне задачи, сколько на коммерческих показателях компании. Он работает со статистикой и может оценить, например, насколько эффективна была рекламная кампания, сколько было продаж в предыдущем месяце и так далее. Вся эта информация может использоваться для улучшения бизнес-показателей компании. Если данных много и нужен какой-то прогноз или оценка, то для решения технической стороны этой задачи бизнес-аналитик может привлечь дата-сайентистов.
Поясним на примере. Допустим, программа анализирует финансовые операции клиента и рекомендует выдать ему кредит или отказать. То есть задача программы — оценить платёжеспособность клиента. Создание такого програмного алгоритма — работа дата-сайентиста.
А бизнес-аналитик не занимается такими техническими задачами. Его не интересует работа с конкретным клиентом, но он может проанализировать всю статистику банка по кредитам, например, за последние три месяца — и рекомендовать банку сократить или увеличить объёмы кредитования. Это бизнес-задача: предлагаются действия, которые увеличат доходность банка либо снизят финансовые риски.
Работа бизнес-аналитика и дата-сайентиста нередко пересекается, просто каждый занимается своей частью задачи.
Используется ли в вашей работе?
Ниже мы составили список задач, которые разные компании решают с помощью машинного обучения. Отметьте те из них, которые актуальны и для вас. А если у вас уже есть идея, которой нет в списке, — допишите ее. Она еще пригодится вам по ходу курса.
Придумав идею, как использовать машинное обучение в работе, вы станете лучше воспринимать информацию курса и будете знать, что и когда можно применить.
- Автоматически прогнозировать цены на товары и услуги в зависимости от сезонности спроса, появления новинок на рынке и результатов продаж в аналогичные периоды предыдущих лет.
- Рекомендовать клиентам дополнительные релевантные продукты, опираясь на историю их выбора, а также поведение других клиентов.
- Оптимизировать закупки и дозаказ оборудования, чтобы оно всегда было на складе, но не залеживалось на нем. Учитывать сезонность, исторические данные продаж, новые контракты и другие факторы.
- Создавать персонализированные предложения для пользователей текущих продуктов, опираясь на историю взаимодействия с ними, и при этом максимизировать выручку бизнеса с каждого предложения.
- Уточнить профиль клиента: лучше понять его интересы и изменение поведения в зависимости от разных факторов, опираясь на имеющийся у нас массив сырых данных.
- Найти новую целевую аудиторию для продукта или услуги, опираясь на обезличенную информацию о массе текущих клиентов.
- Научиться лучше понимать причины оттока пользователей по истории их поведения и взаимодействия с ними: например, выявлять аномальные события, которые могут серьезно сказываться на их лояльности, но не лежать на поверхности.
- Научить программу распознавать голос и лицо человека для его идентификации без документов, пропусков и так далее.
Как понять, что вашей компании нужен
Если компания связана с технологиями, например, разработкой искусственного интеллекта или инструментов автоматизации, Data Scientist ей нужен с самого старта.
Если компания напрямую не связана с IT, Data Scientist обычно становится нужен, когда данных и бизнес-процессов много, ими сложно управлять вручную. Обычно такое происходит в крупных компаниях, которые уже перепробовали разные способы увеличить прибыль и пришли к тому, что нужно извлекать новую информацию из собранных данных, автоматизировать отдельные процессы и искать другие подходы к работе с клиентами.
«Если бизнес уже цифровизован, Data Scientist однозначно нужен хотя бы для наведения порядка в IT-системах и поиска инсайтов для извлечения дополнительной прибыли. Если бизнес не цифровизован, Data Scientist тоже пригодится, чтобы что-нибудь спрогнозировать, проанализировать конкурентов или подсказать, как подойти к вопросу цифровизации. Например, представим агрофирму, которая выращивает продукты. Data Scientist может помочь ей спрогнозировать влажность почвы на полях и сформировать график полива».
Илья Шутов, руководитель направления Data Science компании «Медиа-Тел», кандидат физико-математических наук
Впрочем, иногда Data Scientist может быть полезен и небольшой компании. Он подскажет, как стоит собирать данные, что можно автоматизировать, где искать проблемы и зоны роста.
«Data Scientist может быть полезен маленькой, но амбициозной компании. Он увидит потенциальные возможности, подскажет, какие данные стоит собирать, и подготовит площадку для развития компании в будущем. На старте для этого можно не брать специалиста в штат, а пригласить на консультацию или нанять на аутсорс».
Александр Северинов, Data Scientist, маркетплейс Ozon
Big Data
Big Data — это различные инструменты, подходы и методы обработки как структурированных, так и неструктурированных данных, которые позволяют использовать эти данные для решения конкретных задач и достижения целей.
Используя анализ Big Data, розничные продавцы смогут заранее узнать, какие продукты будут хорошо продаваться, телекоммуникационные компании смогут предсказать, захочет ли клиент сменить оператора и когда это произойдёт, а страховые компании смогут оценить, насколько безопасно их клиенты управляют автомобилем. Среди прочего, анализ Big Data позволяет нам лучше понимать и прогнозировать эпидемии болезней и находить самые эффективные способы лечения.
Машинное Обучение
Цитируя Тома Митчела: Машинное обучения изучает вопрос создания программ, способных улучшаться в процессе обучения.
Машинное Обучение носит междисциплинарный характер и использует, среди прочего, методы из области информатики, статистики и искусственного интеллекта.
Основной областью исследований в Машинном Обучении являются алгоритмы, которые способны обучаться и запоминать и могут применяться в различных областях науки и бизнеса.
Основные разделы
Чтобы освоить Data Science с нуля, первым делом нужно изучить три основных раздела машинного обучения:
- Обучение с учителем (Supervised Learning)
Позволяет спрогнозировать результат по заранее размеченным данным. Если нужно предсказать несколько значений (например отличить фотографии машин от самолётов и поездов), то это задача классификации, если одно (скажем, предположить цену квартиры в зависимости от её характеристик) — задача регрессии. - Обучение без учителя (Unsupervised learning)
Здесь входные данные не размечены, то есть ни результат, ни способ обработки данных не известны заранее. В пример можно привести поиск аномалий — необычных транзакций по кредитной карте, ошибочных показаний датчиков и тому подобное. - Обучение с подкреплением (Reinforcement learning)
Исходные данные тоже не размечены, но при каждом действии нейросеть получает стимул — положительный или отрицательный. По такому принципу ИИ учат играть в компьютерные игры, например в Dota 2 и Starcraft II.
Книги по теме
- «Машинное обучение. Наука и искусство построения алгоритмов, которые извлекают знания из данных» П. Флах — книга о методах построения моделей и алгоритмах МО.
- «Вероятностное программирование на Python: байесовский вывод и алгоритмы», К. Дэвидсон-Пайлон — рассказывает об алгоритмах обработки данных и развивает аналитические навыки.
- «Введение в машинное обучение с помощью Python», А. Мюллер, С. Гвидо — книга для оттачивания практических навыков машинного обучения.
Откуда прийти в профессию и куда расти
Дата-сайентист действительно нуждается в хорошей математической подготовке. Он работает со сложными математическими моделями, поэтому хотя бы средний уровень высшей математики, теории вероятностей и статистики должен быть обязательно.
Это — одна из главных причин, почему лишь немногие специалисты попадают в сферу Data Science с нуля. Подтянуть необходимый математический базис можно и без университетской подготовки, но это сложно.
Чаще всего в Data Science уходят из аналитики данных. Data Analyst уже обладает практически всеми необходимым компетенциями и знанием специальных инструментов. Ему нужно подтянуть только математику и более прикладные области вроде машинного и глубокого обучения.
Python-разработчику тоже открыта дорога в Data Science. Большинство компаний требуют именно знания Python как ЯП для аналитики. Если есть хоть какая-нибудь математическая подготовка и знание SQL — вообще прекрасно.
Сейчас вся сфера Data Science находится в стадии активного роста, поэтому перспективы прекрасные. Профессионал высокого уровня может расти как вертикально, так и горизонтально. То есть можно вырасти в главу отдела Data Science, который, по сути, является вице-президентом компании, — его влияние на стратегическое планирование всей деятельности просто огромно. Или же можно попробовать себя практически в любой другой отрасли аналитики — бизнес-аналитика, продуктовая аналитика, аналитика программного обеспечения, системная аналитика.
Некоторые дата-сайентисты уходят назад в разработку на Python, но таких не слишком много. Можно попробовать и более интересные варианты — например, архитектура искусственного интеллекта для компьютерных игр.
Вузы и курсы
- Московский гуманитарный университет, МосГУ
- Национальный исследовательский технологический университет «МИСиС» Прикладная математика (Институт информационных технологий и компьютерных наук)
- Национальный исследовательский университет «МЭИ» Математическое и программное обеспечение вычислительных машин и компьютерных сетей (Институт информационных и вычислительных технологий НИУ «МЭИ»)
- Московский технический университет связи и информатики Прикладная математика (Факультет общетехнический-1 МТУСИ)
- Российский новый университет Математическое моделирование и вычислительная математика (Институт информационных систем и инженерно-компьютерных технологий РосНОУ)
Как и в любой профессии здесь важно самообразование, несомненную пользу которому принесут такие ресурсы, как:
- онлайн-курсы ведущих университетов мира COURSERA;
- канал машинного обучения MASHIN LEARNING;
- подборка курсов edX;
- курсы Udacity;
- курсы Dataquest, на которых можно стать настоящим профи в Data Science;
- 6-шаговые курсы Datacamp;
- обучающие видео O’Reilly;
- скринкасты для начинающих и продвинутых Data Origami;
- ежеквартальная конференция специалистов Moskow Data Scients Meetup;
- соревнования по анализу данных Kaggle.сom
Курсы:
1. A crash course in Data Science
Курс хочет быстро научить разбираться в работе с большими данными. Здесь не будет кучи технических терминов — всё сосредоточено на понимании общих принципов больших данных: основные термины, роль больших данных в бизнесе, основные инструменты, используемые для работы с большими объемами информации. В общем, хороший курс для знакомства с темой.
2. Building a Data Science Team
На этом курсе речь пойдет о команде аналитики больших данных. Узнаете какие роли должны быть в команде, как управлять такими командами, как подобрать подходящих специалистов и эффективно выстроить рабочий процесс.
3. The Data Scientist’s Toolbox
Время практики! Авторы курса дают обзор типов данных, рассказывают о подходах и методологиях обработки информациии. После вводной теории, вас познакомят с инструментами для работы: Git, R и RStudio — самые популярные штуки, которые помогают обрабатывать массивы информации, и украсят резюме дата майнера!
4. Stepic Contest. Data Science
Еще одно обзорное путешествие в мир больших данных. Крутизна курса заключается в его умении автоматически адаптироваться под любой уровень знаний студента. Stepik недавно запустили самонастраиваемые программы, поэтому советуем скорее оценить на благо знаний и улучшения сервиса.
5. Факультет искусственного интеллекта от GeekBrains
После завершения обучения ты станешь специалистом по машинному обучению, искусственному интеллекту, нейронным сетям и Data Science. А подтверждением навыков станут диплом и сертификат от GeekBrains.
Кому подойдёт:
- Тем, кому надоела старая работа.
- Новичкам в аналитике.
- Разработчикам.
Чему научат:
- Основам языка Python.
- Линейной алгебре.
- Алгоритмам анализа данных.
- Применению машинного обучения в бизнесе.
- Работе с рекомендательными системами.
- Использованию фреймворков для разработки нейронных сетей.
- + Курсы вне четверти (один из 8 предметов на выбор).
- + Дополнительные курсы от партнеров GeekBrains.
Сколько длится: 18 месяцев.
Цена: 270 000 рублей, или 162 000 рублей со скидкой.
6. Факультет аналитики Big Data от GeekBrains
Рабочих мест для спецов по Big Data много, а их самих — ничтожно мало. Ребята из GeekBrains гарантированно трудоустроят тебя.
Кому подойдёт:
- IT-специалистам.
- Студентам технических ВУЗов.
- Заинтересованным в работе с ИИ.
- Тем, кто хочет работать как в России, так и заграницей.
Чему научат:
- Работе с языком SQL.
- Фундаменту языка Python.
- Сбору данных.
- Обработке неструктурированных данных.
- Работе с Hadoop.
- Теории вероятности и математической статистике.
- А/Б тестированию.
- Использованию машинного обучения в реальных проектах.
Сколько длится: 18 месяцев.
Цена: 270 000 рублей, 362 000 рублей.
7. Полный курс по Data Science от SkillFactory
Главное направление SkillFactory — профессии, связанные с обработкой данных. На этом курсе ты создашь 10 проектов для своего портфолио, отточишь навыки в тренажерах и поучаствуешь в хакатонах.
Кому подойдёт:
- Новичкам в IT.
- Практикующим программистам.
- Начинающим аналитикам.
Чему научат:
- Языку программирования Python для анализа данных.
- Математике и статистике.
- Машинному обучению на практике.
- Глубокому обучению и нейронным сетям (инструменты, типы и анализ естественного языка).
- Data Engineering (инструменты Hadoop, Spark и cloud-технологии).
- Управлению DS-проектами.
Сколько длится: 12 месяцев.
Цена: 189 996 рублей без скидки, 142 500 рублей со скидкой.
8. «Профессия Data Scientist» от Нетологии
«Нетология» — один из крупнейших онлайн-университетов России, по окончании обучения выдаёт удостоверение или диплом о профессиональной переподготовке установленного государством образца (при наличии высшего образования), а также красивый именной сертификат для тех, кто по каким-либо причинам не имеет «вышки».
Официальная страница курса: https://netology.ru/programs/data-scientist .
Длительность: чуть меньше 1 года.
Формат обучения: онлайн-видеолекции в прямом эфире + очные лекции в московском кампусе «Нетологии» + домашние практические задания с проверкой и обратной связью + общение с единомышленниками и личным наставником в Telegram + создание групповых и индивидуальных проектов для портфолио.
Стоимость: 200 000 без скидки, 130 000 рублей со скидкой. В рассрочку (беспроцентный кредит) на 24 месяца — от 5 417 рублей в месяц.
Особенности:
- Помощь с трудоустройством
- Присутствует возможность посещения очных занятий
- Очень насыщенная обучающая программа
Доход
Исследование рынка аналитиков компании «Нормальные исследования» и рекрутингового агентства New.HR показывает, что специалисты по Data Science получают в среднем большую зарплату, чем аналитики других специальностей.
В России начальная зарплата дата-сайентиста с опытом работы до года — от 113 тыс. рублей.
В качестве опыта работы сейчас также учитывается прохождение обучающих программ.
Через 1‒2 года такой специалист уже может получать до 160 тыс. рублей.
Для сотрудника с опытом работы от 4‒5 лет вилка вырастает до 310 тыс.
Заключение
Стать экспертом в Data Science непросто: приходится изучать множество инструментов и быть гибким, чтобы вовремя узнавать о трендах.
Хорошая стратегия — получить базу по Data Science на фундаментальном курсе, а новые инструменты и технологии изучать, решая практические задачи на работе.
- https://academy.yandex.ru/posts/chem-zanimaetsya-spetsialist-po-data-science-i-kak-nachat-rabotat-v-etoy-oblasti
- https://netology.ru/blog/01-2020-gid-po-data-science
- https://zen.yandex.ru/media/mcs/kto-takoi-data-scientist-chto-eto-za-professiia-i-kakim-kompaniiam-nujen-takoi-specialist-5f905d456ca69c78029cf632
- https://www.alpinabook.ru/blog/nauka-o-dannykh-chto-eto-takoe-i-gde-ey-uchitsya/
- https://techrocks.ru/2020/03/13/learn-data-science-for-free/
- https://www.profguide.io/professions/data_scientist.html
- https://www.tadviser.ru/index.php/%D0%A1%D1%82%D0%B0%D1%82%D1%8C%D1%8F:%D0%9D%D0%B0%D1%83%D0%BA%D0%B0_%D0%BE_%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85_(Data_Science)
- https://skillbox.ru/media/code/chto_takoe_data_science_i_kto_takoy_data_scientist/
- https://nplus1.ru/material/2020/03/27/course-data-science-chapter-1
- https://blog.skillfactory.ru/perevod/what_is_ds/
- https://tproger.ru/translations/a-beginners-guide-to-data-science/
- https://habr.com/ru/company/skillfactory/blog/529112/
- https://habr.com/ru/company/icanchoose/blog/348570/
- https://GeekTarget.ru/kursy-data-science/
- https://zen.yandex.ru/media/bogatey/data-scientist--chto-eto-za-professiia-takaia-i-pochemu-specialistam-po-data-science-platiat-ot-100-000-rublei-v-mesiac-5eea201a7021972fe7372245
- https://netology.ru/blog/04-2020-data-engineer-data-scientist-navyki-dokhod
- https://tproger.ru/curriculum/data-science-expert-plan/