Большие данные Анализировать данные Scikit-learn XGBoost SQL-запрос Решать задачи машинного обучения Python Jupyter Notebook Писать программный код

Специалист по Data Science

Яндекс
580,00 часов длительность
Онлайн формат
Базовый уровень
1 поток (закрыт) 21.09.2021-12.07.2022
2 поток (закрыт) 05.10.2021-26.07.2022
3 поток (закрыт) 19.10.2021-10.08.2022
4 поток (закрыт) 01.11.2021-24.08.2022
5 поток (закрыт) 15.11.2021-07.09.2022
6 поток (закрыт) 29.11.2021-21.09.2022
7 поток (закрыт) 20.12.2021-11.10.2022
8 поток (закрыт) 23.12.2021-25.10.2022
9 поток (закрыт) 24.12.2021-02.11.2022
10 поток (закрыт) 28.12.2021-16.11.2022
11 поток (закрыт) 28.12.2021-23.11.2022

Описание

В течение 5 рабочих дней с момента подачи заявки с вами свяжется менеджер Яндекс.Практикума для проведения вступительного интервью. Обратите внимание, что звонок поступает с номера 8-495-981-24-78. Это обязательный этап зачисления на курс, пожалуйста, будьте на связи.

Специалист по Data Science структурирует и анализирует большие объёмы данных, применяет машинное обучение для предсказания событий и обнаружения неочевидных закономерностей. Помогает создавать и улучшать продукты в бизнесе, промышленности и науке. Мы хотим научить вас основным инструментам этой профессии: Python и его библиотекам, в том числе Scikit-Learn и XGBoost; Jupyter Notebook, SQL.

Зарплата специалиста по Data Science :
Junior — 40 000 - 80 000 рублей
Middle — 80 000 - 140 000 рублей
Senior — от 140 0000 
Источник данных: Хабр Карьера

 

Чему вы научитесь на курсе:

  • писать ясный, гибкий, эффективный и работающий код программ на языке программирования Python; 
  • ставить и проверять статистические гипотезы;
  • извлекать данные запросами на языке SQL;
  • работать с данными в различных форматах;
  • применять методы анализа данных в решении прикладных задач;
  • восстанавливать закономерности из эмпирических данных,  применять различные методы машинного обучения.

За 8 месяцев обучения по 15 часов в неделю вы освоите востребованные навыки и соберёте портфолио. Вот какие проекты в него войдут:

  • прогнозирование оттока клиентов банка;
  • анализ прибыли и убытков нефтедобывающей компании;
  • оптимизация работы предприятия золотодобывающей отрасли.

 

О компании

Яндекс.Практикум — это сервис онлайн-образования, где каждый может получить навыки для работы и жизни. Всё обучение проходит в собственной технологической среде, где можно на практике применить полученные навыки. 

 

Почему Яндекс Практикум

Погружение в IT-профессию подразумевает постоянный контакт с изучаемыми технологиями, выполнение практических заданий и общение с наставником. Для этого мы создали собственную среду обучения:

  • Онлайн-тренажер
    С первого дня вы учитесь на практике. Мы даём реальные кейсы, которые закрепляют теоретические основы. Вы сможете обучаться в своём темпе.
  • Самостоятельная работа
    Тренажер — это только часть обучения. Основные навыки вы приобретете по мере решения задач инструментами профессиональных тестировщиков. Наставники помогут и дадут обратную связь.
  • Поддержка
    Команда наставников проверяет и комментирует ваши работы, помогает разобраться в сложностях и обучает собственным профессиональным приёмам. Поддержка в чате доступна 24/7.

 

71,1% выпускников трудоустраиваются

Мы делаем всё, чтобы студенты нашли новую работу: выдаем официальный диплом, учим собирать портфолио проектов, помогаем с поиском работы.

71,1% выпускников находят работу, большинство из них за 4 месяца. Институт образования НИУ ВШЭ подтвердил данные через исследование трудоустройства выпускников.

 

Часов в программе
221,00 час
практика
203,00 часа
самостоятельная
115,00 часов
промежуточная аттестация
1 час
входная диагностика
40 часов
итоговая аттестация
580,00 часов
всего
Цель программы
Цель: получение слушателями профессиональных компетенций в области анализа данных и машинного обучения, подготовка специалистов в области анализа данных и машинного обучения.
Актуальность
Актуальность программы обуславливается растущим спросом на специалистов в области обработки и анализа больших данных. В XXI веке бизнесу и государству особенно важно уметь прогнозировать и предсказывать различные сценарии развития событий, которые повлияют на них. В экономике и других сферах одновременно взаимодействуют множество факторов — от точности прогнозов зависит благосостояние и выживание организаций и стран. Ключевой элемент точных прогнозов — грамотная работа с данными, источники и объём которых значительно увеличиваются ежедневно.
Входная диагностика 1 час
После оставления заявки с вами свяжется специалист и проведет короткое интервью, чтобы убедиться, что вам подходит выбранная программа.
Итоговая аттестация 40 часов
Дипломный проект

Компетенции

Профессиональные


Основы Python и анализа данных
Знать:

Основы синтаксиса, списки и циклы, операции с таблицами, условия и функции, Pandas для анализа данных.

Уметь:

Основы программирования на Python, предобработка данных, анализ данных и оформление результатов.

Владеть:

Python, библиотека Pandas для анализа данных, Jupyter Notebook.

Работа с данными
Знать:

Работа с пропусками, срезы данных, работа с несколькими источниками данных, взаимосвязь данных, описательная статистика, теория вероятностей.

Уметь:

Изменение типов данных, Категоризация данных, Поиск дубликатов, Переработка данных, Построение графиков, Валидация результатов, Проверка гипотез

Владеть:

Язык программирования для создания, модификации и управления данными в реляционной базе данных — SQL, Язык программирования общего назначения, ориентированный на повышение производительности разработчика и читаемости кода — Python

Основы машинного обучения
Знать:

Метрики классификации, Регрессия, Метрики регрессии, Метрики бизнеса, Модели и алгоритмы.

Уметь:

Улучшение модели, Подготовка признаков, Запуск новой функциональности, Сбор данных, Прямое кодирование.

Владеть:

Язык программирования общего назначения, ориентированный на повышение производительности разработчика и читаемости кода — Python

Продвинутое машинное обучение,
Знать:

Матрицы и матричные операции, Градиентный бустинг, Векторы и векторные операции, Линейная алгебра в машинном обучении, Обучение моделей градиентным спуском, Векторизация текстов, Языковые представления.

Уметь:

Реализация линейной регрессии, Анализ алгоритмов, Анализ и прогнозирование временных рядов.

Владеть:

Язык программирования для создания, модификации и управления данными в реляционной базе данных — SQL, Язык программирования общего назначения, ориентированный на повышение производительности разработчика и читаемости кода — Python

Работа с большими объемами данных
Знать:

Базы данных и таблицы, Расширенные возможности SQL, Полносвязные нейронные сети, Свёрточные нейронные сети.

Уметь:

Извлечение данных с помощью SQL, Кластеризация данных, Обнаружение аномалий в данных.

Владеть:

SQL для работы с данными, PySpark, Архитектура LeNet, Библиотека Keras

Требования

Нет

Образование
  • Высшее образование
  • Среднее профессиональное образование

Модули

свернуть
20,00ч
Модуль 1 Основы Python и анализа данных
Познакомитесь с языком программирования Python, библиотекой Pandas, а также средой программирования Jupyter. Узнаете основные концепции анализа данных и поймёте, чем занимаются аналитики и специалисты по Data Science.
100,00ч
Модуль 3 Анализ данных
Изучите основы теории вероятностей и статистики. Примените их для исследования основных свойств данных, поиска закономерностей. Научитесь анализировать взаимосвязи в данных методами статистики. Узнаете, что такое статистическая значимость, гипотезы и доверительные интервалы.
140,00ч
Модуль 5 Продвинутое машинное обучение
На практике освоите с нуля главные концепции линейной алгебры. Разберёте ряд алгоритмов и приспособите их к решению практических задач с использованием численных методов. Проанализируете временные ряды. Представите тексты на естественном языке в качестве таблиц с данными.
38,00ч
Модуль 2 Предобработка данных
Научитесь очищать данные от выбросов, пропусков и дубликатов, а также преобразовывать разные форматы данных.
135,00ч
Модуль 4 Основы машинного обучения
Освоите основные концепции машинного обучения. Познакомитесь с библиотекой Scikit-Learn и примените её для создания первого проекта с машинным обучением.
106,00ч
Модуль 6 Машинное обучение для больших объёмов данных
Познакомитесь с основными системами хранения данных — реляционными базами и распределёнными хранилищами. Научитесь извлекать эти данные запросами на языке SQL и методами библиотеки PySpark. Решите базовые задачи на компьютерное зрение. Познакомитесь с задачами кластеризации и поиска аномалий.
20,00ч
Модуль 1 Основы Python и анализа данных
Познакомитесь с языком программирования Python, библиотекой Pandas, а также средой программирования Jupyter. Узнаете основные концепции анализа данных и поймёте, чем занимаются аналитики и специалисты по Data Science.
38,00ч
Модуль 2 Предобработка данных
Научитесь очищать данные от выбросов, пропусков и дубликатов, а также преобразовывать разные форматы данных.
100,00ч
Модуль 3 Анализ данных
Изучите основы теории вероятностей и статистики. Примените их для исследования основных свойств данных, поиска закономерностей. Научитесь анализировать взаимосвязи в данных методами статистики. Узнаете, что такое статистическая значимость, гипотезы и доверительные интервалы.
135,00ч
Модуль 4 Основы машинного обучения
Освоите основные концепции машинного обучения. Познакомитесь с библиотекой Scikit-Learn и примените её для создания первого проекта с машинным обучением.
140,00ч
Модуль 5 Продвинутое машинное обучение
На практике освоите с нуля главные концепции линейной алгебры. Разберёте ряд алгоритмов и приспособите их к решению практических задач с использованием численных методов. Проанализируете временные ряды. Представите тексты на естественном языке в качестве таблиц с данными.
106,00ч
Модуль 6 Машинное обучение для больших объёмов данных
Познакомитесь с основными системами хранения данных — реляционными базами и распределёнными хранилищами. Научитесь извлекать эти данные запросами на языке SQL и методами библиотеки PySpark. Решите базовые задачи на компьютерное зрение. Познакомитесь с задачами кластеризации и поиска аномалий.
95 000 p
Авторизуйтесь чтобы записаться

Профстандарт

Специалист по Data Science

06.042

Ответственный за программу