III уровень

Инструменты анализа данных

Яндекс
330 часов длительность
Онлайн формат
Базовый уровень
1 поток 27.06-22.11.2024
2 поток 28.06-23.11.2024

Описание

На этом курсе вы научитесь:

  • готовить данные к анализу и находить закономерности в них
  • писать запросы разной степени сложности к базам данных
  • строить дашборды в Tableau

Курс подойдёт вам, если:

  • вы никогда не работали в IT и у вас нет технического образования
  • у вас есть опыт работы с данными, но не хватает знаний по Python, SQL, Tableau
  • вы готовы уделять учебе от 10 часов в неделю

 

Что вы будете делать:

  • Учиться 5 месяцев от 10 часов в неделю, включая 2 недели каникул
  • Заниматься онлайн с поддержкой наставников
  • Осваивать Python и его библиотеки, Jupyter Notebook, SQL и Tableau
  • Практиковаться в интерактивном тренажере
  • Выполнять самостоятельные и проверочные работы

О компании

Яндекс Практикум — это сервис онлайн-образования, в котором ваш процесс обучения основан на реальных ситуациях. Вы учитесь программированию и с первого урока пишете код. 

Почему Яндекс Практикум

Практикум — это насыщенная и проработанная среда.

  • Понятная теория
    Термины и правила подкреплены примерами из жизни. Сложность и длина курса рассчитаны так, чтобы каждую следующую главу вы понимали всё лучше.
  • Практика в тренажёре
    Пишите код, ошибайтесь, быстро получайте обратную связь и исправляйте ошибки.

Практикум — это команда, которая помогает на трудном пути
 

  • Преподаватели помогают понять теорию
    Обращайтесь к ним, когда не получается решить задачу или что-то непонятно в теории.
     
  • Код-ревьюеры проверяют ваш код и проекты.
    Они укажут на ошибки и дадут обратную связь. Каждый из них – практикующий специалист по анализу данных. 
  • Наставники учат находить ответы
    Это опытные работающие специалисты, которые отвечают на вопросы по предметной области и индустрии и раз в де недели проводят вебинары. С ними вы разберёте сложные кейсы и обсудите свои вопросы
     
  • Кураторы делают обучение комфортным
    Они отвечают на вопросы, напоминают о сроках, присылают ссылки на записи лекций, слушают и поддерживают.
     
  • Поддержка 24/7
    Специалисты поддержки помогают со всеми техническими моментами. На случай, если вы будете учиться ночью или в другом часовом поясе.
Часов в программе
72 часа
лекции
117 часов
практика
51 час
самостоятельная
54 часа
промежуточная аттестация
1 час
входная диагностика
35 часов
итоговая аттестация
330 часов
всего
Цель программы
Цель программы: Совершенствование имеющихся у слушателей компетенций и формирование новых компетенций в области искусственного интеллекта, анализа данных и машинного обучения.
Актуальность
В XXI веке бизнесу и государству особенно важно уметь прогнозировать и предсказывать различные сценарии развития событий, которые повлияют на них. В экономике и других сферах одновременно взаимодействуют множество факторов — от точности прогнозов зависит благосостояние и выживание организаций и стран. Ключевой элемент точных прогнозов — грамотная работа с данными, источники и объём которых значительно увеличиваются ежедневно.

Для это необходимы профессионалы, которые умеют исследовать проблему, формулировать и проверять с помощью инструментов анализа данных гипотезы, а также с помощью алгоритмов и моделей машинного обучения предсказывать следующий виток в развитии того или иного явления: будь это рыночный спрос или поворот самоуправляемой машины.
Входная диагностика 1 час
Входная диагностика поступившего на курс слушателя проводится в виде тестирования
Итоговая аттестация 35 часов
Проектная работа. Применение полученных знаний к реальной задаче Data Science из золотодобывающей отрасли.

Компетенции

Профессиональные


Способен классифицировать и идентифицировать задачи искусственного интеллекта, выбирать адекватные методы и инструментальные средства решения некоторых задач искусственного интеллекта
Знать:

- знать основы языка программирования Python, его синтаксис и структуры;
- знать основы обработки данных в Python;
- знать основы работы с базами данных

Уметь:

- уметь проводить оценку сложности алгоритмов;
- уметь программировать и тестировать программы;
- уметь работать с библиотекой Pandas;
- уметь выбирать методы и инструментальные средства ИИ для решения некоторых задач в зависимости от особенностей проблемной области;

Владеть:

- навыком применения к решению прикладных задач алгоритмов обработки данных;
- навыками загрузки датасета, преобразования и осуществления срезов данных, проведения описательного анализа, построения графиков распределения, визуализации разных признаков, их распределения, агрегирования признаков, выявления топа коррелируемых признаков, оценки взаимосвязи;
- навыком работы с библиотекой Pandas

Способен использовать на начальном уровне методы машинного обучения для решения задач.
Знать:

- знать методы машинного обучения;
- знать основные парадигмы машинного обучения.
- знать базовую терминологию машинного обучения;
- знать метрики оценки результатов моделирования и критерии качества построенных моделей;

Уметь:

- уметь проводить анализ качества построенной модели линейной регрессии с помощью библиотеки Scikit-Learn;
- уметь распознавать такие парадигмы машинного обучения, как обучение с учителем и обучение без учителя, а также ситуации, в которых машинное обучение не применимо;
- уметь отличать классификацию от регрессии, а модель — от алгоритма обучения;

Владеть:

- владеть навыками работы с библиотекой машинного обучения Scikit-Learn;
- владеть навыками построения модели линейной регрессии с помощью библиотеки Scikit-Learn;
владеть - навыками решения оптимизационных задач.

Способен использовать инструментальные средства для решения некоторых задач машинного обучения, анализа и визуализации данных.
Знать:

- знать язык программирования Python и язык баз данных SQL;
- знать электронные библиотеки Pandas, Seaborn, Scikit-Learn, пакет программы Tableau;

Уметь:

- уметь обучать простые модели линейной регрессии, делать выводы.

Владеть:

- владеть навыком проведения анализа требований и определения необходимых шагов в простых задачах машинного обучения с помощью линейной регрессии и бинарной классификации;
-владеть навыком построения дашбордов в BI-системе Tableau: подключаться к данным и модифицировать их, строить графики разных видов, собирать дашборды и презентации;
- владеть навыком составления запросов к базам данных и получением данных из них.
- владеть навыком оценки и выбора некоторых используемых методов машинного обучения.

Способен осуществлять сбор и подготовку данных для анализа данных.
Знать:

- знать основные виды представления данных: табличные, графовые, временные ряды;
- знать основные уровни представления данных.

Уметь:

- уметь использовать основные статистические методы анализа данных при решении профессиональных задач.

Владеть:

- владеть навыком поиска данных в открытых источниках, специализированных библиотеках и репозиториях.

Требования

Нет

Владение необходимыми профессиональными компетенциями
Слушатель до начала обучения должен иметь представление:
- о том как работать в ОС Windows, MacOS или Linux;

Знать:
- математику на среднем школьном уровне;
- русский язык - свободное владение;

Уметь:
- пользоваться браузером Chrome/Яндекс на уровне пользователя;
- устанавливать и запускать программы на базе ОС Windows, MacOS или Linux;

Владеть:
- навыком поиска информации с помощью Yandex или Google.

Модули

свернуть
196ч
Модуль 1 Введение в анализ данных
Слушатель узнает основные концепции анализа данных и поймёт, чем занимаются аналитики данных и специалисты по Data Science. Изучит основы работы с Python и библиотекой Pandas, научится очищать данные от выбросов, пропусков и дубликатов, преобразовывать разные форматы данных. Изучит основы теории вероятностей и статистики. Научится анализировать взаимосвязи в данных методами статистики.
62ч
Модуль 3 Инструменты и типы анализа данных
Слушатель изучит основы языка запросов SQL для работы с базами данных. Познакомится с BI-системой Tableau, научится подключатся к данным и модифицировать их, строить графики разных видов, собирать дашборды и презентации. Обзорно познакомится с типами анализа данных и машинного обучения.
36ч
Модуль 2 Основы машинного обучения
Слушатель освоит основные концепции машинного обучения, познакомится с библиотекой scikit-learn.
196ч
Модуль 1 Введение в анализ данных
Слушатель узнает основные концепции анализа данных и поймёт, чем занимаются аналитики данных и специалисты по Data Science. Изучит основы работы с Python и библиотекой Pandas, научится очищать данные от выбросов, пропусков и дубликатов, преобразовывать разные форматы данных. Изучит основы теории вероятностей и статистики. Научится анализировать взаимосвязи в данных методами статистики.
36ч
Модуль 2 Основы машинного обучения
Слушатель освоит основные концепции машинного обучения, познакомится с библиотекой scikit-learn.
62ч
Модуль 3 Инструменты и типы анализа данных
Слушатель изучит основы языка запросов SQL для работы с базами данных. Познакомится с BI-системой Tableau, научится подключатся к данным и модифицировать их, строить графики разных видов, собирать дашборды и презентации. Обзорно познакомится с типами анализа данных и машинного обучения.

Преподаватели

Ненахов

Евгений Валентинович

Федеральное государственное бюджетное образовательное учреждение высшего образования «Московский авиационный институт (национальный исследовательский университет)»

доцент кафедры вычислительной математики и программирования

канд. физ.-мат. наук

Баранников

Кирилл Анатольевич

ООО "Яндекс"

Руководитель направления по работе с вузами

Кандидат педагогических наук

Проничев

Артем Валерьевич

АО "Позитив Технолоджиз"

Руководитель группы анализа событий безопасности

Гученко

Роман Александрович

ООО "Кримтех"

Разработчик баз данных

Кандидат физико-математических наук

Авторизуйтесь чтобы записаться

Профстандарт

Специалист по большим данным

06.042

Специальность

Аналитик данных (Data Scientist)

Ответственный за программу