Модуль 3
40,00ч

Знакомство с данными. Python для Анализа данных

1.Инструменты DS
2.Работа с числами в numpy
3.Введение в pandas
4.Очистка данных
5.Визуализация данных
6.Проект 1. Аналитика датасета по закрытым вопросам
Часов в программе
7,00 часов
лекции
10,00 часов
практика
18,00 часов
самостоятельная
5,00 часов
промежуточная аттестация
40,00 часов
всего
Материально-технические условия реализации программы:
Вид занятий: внеаудиторные
Требуемое ПО:
Процессор Intel Pentium Silver N5030 1.1 ГГц
Оперативная память (RAM) от 4 ГБ
Операционная система: Windows 10, macOS
Стабильный интернет: от 5/мбит с
Информационные ресуры
-Онлайн курс “Математическая статистика” https://stepik.org/course/326/promo (ОПК-2, ПК-2)
-Документация по работе с Pickle: https://docs.python.org/3/library/pickle.html (ПК-7)
-Документация по работе с Joblib: https://joblib.readthedocs.io/en/latest/ (ПК-7)
-Официальная документация virtualenv https://virtualenv.pypa.io/en/latest/ (ПК-7)
-Список команд Docker https://docs.docker.com/engine/reference/run/ (ПК-7)
-Обновляемый список ресурсов и плагинов для Flask https://github.com/humiaozuzu/awesome-flask (ПК-7)
-Официальное руководство RabbitMQ на русском языке (ПК-7)
-Youtube канал для дополнительного изучения нейронных сетей Arxiv Insights https://www.youtube.com/watch?v=JgvyzIkgxF0&feature=youtu.be (ОПК-2)
-Видео курс «Essence of linear algebra» https://www.youtube.com/playlist?list=PLZHQObOWTQDPD3MizzM2xVFitgF8hE_ab (ОПК-2)
-Онлайн курс «Convex Optimization»: https://lagunita.stanford.edu/courses/Engineering/CVX101/Winter2014/about (ОПК-2, ПК-2)
Образовательные ресуры
-Онлайн курс “Математическая статистика” https://stepik.org/course/326/promo (ОПК-2, ПК-2)
-Документация по работе с Pickle: https://docs.python.org/3/library/pickle.html (ПК-7)
-Документация по работе с Joblib: https://joblib.readthedocs.io/en/latest/ (ПК-7)
-Официальная документация virtualenv https://virtualenv.pypa.io/en/latest/ (ПК-7)
-Список команд Docker https://docs.docker.com/engine/reference/run/ (ПК-7)
-Обновляемый список ресурсов и плагинов для Flask https://github.com/humiaozuzu/awesome-flask (ПК-7)
-Официальное руководство RabbitMQ на русском языке (ПК-7)
-Youtube канал для дополнительного изучения нейронных сетей Arxiv Insights https://www.youtube.com/watch?v=JgvyzIkgxF0&feature=youtu.be (ОПК-2)
-Видео курс «Essence of linear algebra» https://www.youtube.com/playlist?list=PLZHQObOWTQDPD3MizzM2xVFitgF8hE_ab (ОПК-2)
-Онлайн курс «Convex Optimization»: https://lagunita.stanford.edu/courses/Engineering/CVX101/Winter2014/about (ОПК-2, ПК-2)

Учебно-методические материалы

Методы, формы и технологии

Формы подачи материала:
-видео
-текст
Методы:
-асинхронная работа студента на платформе
-синхронная работа на вебинарах с преподавателями
-самостоятельная работа (выполнение заданий)

Методические разработки

Методические разработки:
1.Анализ рынок конкурентов — изучаем, что предлагают другие школы — и рынок вакансий, чтобы давать востребованные знания и навыки.
2.Проработка критериев по набору экспертов и авторов программы
3.Разработка контента в обучающие материалы и проектирование структуры курса
4.Анализ рынка вакансий на предмет актуальности знаний
5.Создание авторами модулей программы.
6.Каждый урок проходит многоуровневое ревью — эксперта, методиста, редактора, студента-тестировщика.
7.Чередование форматов подачи информации (текст — видео— таблица).
8.Обязательно предоставление ссылок на дополнительные источники — документацию и полезные статьи, которые помогут лучше понять тему и расширят кругозор студента
9.В конце каждой темы у нас есть:
-итоговое тестирование, чтобы привести знания теории всистему, большая практическая задача для закрепления всех необходимых навыков модуля.
10.Обработка обратной связи от студентов по каждому модулю

Материалы курса

-Обзор Инструментов DS и зачем они нужны
-ОС для DS
-Что такое IDE
-Установка и настройка VSCode
-Обзор базовых функций
-Anaconda и Jupyter
-Плагины
-Работа с github
-Модуль pandas и его объекты (Series, Dataframe)
-Создание датафреймов различными способами
-Исследование структуры данных
-Использование индексов и фильтрация данных
-Анализ данных в датафреймах: типы серий и диапазоны значений
-Работа с пропущенными значениями
-Работа с дубликатами
-Обзор диаграмм в примерах
-Базовые возможности matplotlib
-Детальная настройка графиков: название, оси, сетка, цвета рядов
-Обзор библиотеки seaborn
-Обзор библиотеки plotly

Учебная литература

1.Основы программирования на языке Python / Златопольский Д..– М.: ДМК Пресс, 2017.– 284 с.: ил
2.Python для сложных задач. Наука о данных и машинное обучение / Вандер Плас Дж. - СПб.: Питер, 2019 - цифровая книга. (ОПК-3)

Темы

Инструменты DS Работа с числами в numpy Введение в pandas Очистка данных Визуализация данных Проект 1. Аналитика датасета по закрытым вопросам
Лекции
1,00ч
Практические занятия
2,00ч
Самостоятельная работа
1,00ч
Всего
4,00ч
Лекции
1,00ч
Практические занятия
3,00ч
Самостоятельная работа
1,00ч
Всего
5,00ч
Лекции
1,00ч
Практические занятия
3,00ч
Самостоятельная работа
1,00ч
Всего
5,00ч
Лекции
2,00ч
Практические занятия
2,00ч
Самостоятельная работа
1,00ч
Всего
5,00ч
Лекции
1,00ч
Самостоятельная работа
7,00ч
Всего
8,00ч
Лекции
1,00ч
Самостоятельная работа
7,00ч
Всего
8,00ч
Промежуточная аттестация 5,00 часов
Практические задания в модуле