Модуль 2
110,00ч

Введение в анализ данных

Глубже погрузитесь в язык программирования Python и работу с библиотекой Pandas. Научитесь очищать данные от выбросов, пропусков и дубликатов, а также преобразовывать разные форматы данных. Изучите основы теории вероятностей и статистики. Примените их для исследования основных свойств данных, поиска закономерностей, распределений и аномалий. Отрисуете диаграммы, поупражняетесь в анализе графиков. Научитесь анализировать взаимосвязи в данных методами статистики. Узнаете, что такое статистическая значимость, гипотезы и доверительные интервалы. Научитесь предварительному исследованию данных, сформулируете и проверите гипотезы.
Часов в программе
25,00 часов
лекции
30,00 часов
практика
40,00 часов
самостоятельная
15,00 часов
промежуточная аттестация
110,00 часов
всего
Материально-технические условия реализации программы:
Вид занятий: Работа в интерактивной онлайн-среде Яндекса
Требуемое ПО:
Google Docs, Google Sheets, MS Office, браузер Google Chrome и/или Яндекс.Браузер,

Учебно-методические материалы

Методы, формы и технологии

Онлайн-тренажёр и интерактивный учебник на LMS Яндекс.Практикума, Практические задания, самостоятельная работа, вебинары и Q&A сессии с наставниками и экспертами курса.

Методические разработки

Тесты, презентации, чек-листы, инструкции практические задания.

Материалы курса

Все материалы расположены в интерактивном учебнике в LMS Яндекс.Практикума

Учебная литература

Большая часть источников для нашей программы — это авторские материалы. Более 100 экспертов, задействованных в разработке и оперировании курса. Также мы следим и постоянно обновляем информацию о технологиях и методах внутри интерактивного учебника. В личном кабинете студента есть также список дополнительной литературы в темам курса.

Темы

Тема 1. Базовый Python Тема 2. Предобработка данных Тема 3. Исследовательский анализ данных
Лекции
10,00ч
Практические занятия
10,00ч
Самостоятельная работа
10,00ч
Всего
30,00ч
Лекции
10,00ч
Практические занятия
10,00ч
Самостоятельная работа
15,00ч
Всего
35,00ч
Лекции
5,00ч
Практические занятия
10,00ч
Самостоятельная работа
15,00ч
Всего
30,00ч
Промежуточная аттестация 15,00 часов
Курсовой проект: основы анализа данных