Модуль 6
93,00ч

Введение в машинное обучение

1. Теория машинного обучения
2. Регрессия
3. Классификация
5. Валидация данных и оценка модели
6. Отбор и селекция признаков
7. Оптимизация гиперпараметров модели
8. ML Cookbook
Часов в программе
11,00 часов
лекции
38,00 часов
практика
36,00 часов
самостоятельная
8,00 часов
промежуточная аттестация
93,00 часа
всего
Материально-технические условия реализации программы:
Вид занятий: внеаудиторные
Требуемое ПО:
Процессор Intel Pentium Silver N5030 1.1 ГГц
Оперативная память (RAM) от 4 ГБ
Операционная система: Windows 10, macOS
Стабильный интернет: от 5/мбит с
Информационные ресуры
-Онлайн курс “Математическая статистика” https://stepik.org/course/326/promo (ОПК-2, ПК-2)
-Документация по работе с Pickle: https://docs.python.org/3/library/pickle.html (ПК-7)
-Документация по работе с Joblib: https://joblib.readthedocs.io/en/latest/ (ПК-7)
-Официальная документация virtualenv https://virtualenv.pypa.io/en/latest/ (ПК-7)
-Список команд Docker https://docs.docker.com/engine/reference/run/ (ПК-7)
-Обновляемый список ресурсов и плагинов для Flask https://github.com/humiaozuzu/awesome-flask (ПК-7)
-Официальное руководство RabbitMQ на русском языке (ПК-7)
-Youtube канал для дополнительного изучения нейронных сетей Arxiv Insights https://www.youtube.com/watch?v=JgvyzIkgxF0&feature=youtu.be (ОПК-2)
-Видео курс «Essence of linear algebra» https://www.youtube.com/playlist?list=PLZHQObOWTQDPD3MizzM2xVFitgF8hE_ab (ОПК-2)
-Онлайн курс «Convex Optimization»: https://lagunita.stanford.edu/courses/Engineering/CVX101/Winter2014/about (ОПК-2, ПК-2)
Образовательные ресуры
-Онлайн курс “Математическая статистика” https://stepik.org/course/326/promo (ОПК-2, ПК-2)
-Документация по работе с Pickle: https://docs.python.org/3/library/pickle.html (ПК-7)
-Документация по работе с Joblib: https://joblib.readthedocs.io/en/latest/ (ПК-7)
-Официальная документация virtualenv https://virtualenv.pypa.io/en/latest/ (ПК-7)
-Список команд Docker https://docs.docker.com/engine/reference/run/ (ПК-7)
-Обновляемый список ресурсов и плагинов для Flask https://github.com/humiaozuzu/awesome-flask (ПК-7)
-Официальное руководство RabbitMQ на русском языке (ПК-7)
-Youtube канал для дополнительного изучения нейронных сетей Arxiv Insights https://www.youtube.com/watch?v=JgvyzIkgxF0&feature=youtu.be (ОПК-2)
-Видео курс «Essence of linear algebra» https://www.youtube.com/playlist?list=PLZHQObOWTQDPD3MizzM2xVFitgF8hE_ab (ОПК-2)
-Онлайн курс «Convex Optimization»: https://lagunita.stanford.edu/courses/Engineering/CVX101/Winter2014/about (ОПК-2, ПК-2)

Учебно-методические материалы

Методы, формы и технологии

Формы подачи материала:
-видео
-текст

Методы:
-асинхронная работа студента на платформе
-синхронная работа на вебинарах с преподавателями
-самостоятельная работа (выполнение заданий)

Методические разработки

Методические разработки:
1.Анализ рынок конкурентов — изучаем, что предлагают другие школы — и рынок вакансий, чтобы давать востребованные знания и навыки.
2.Проработка критериев по набору экспертов и авторов программы
3.Разработка контента в обучающие материалы и проектирование структуры курса
4.Анализ рынка вакансий на предмет актуальности знаний
5.Создание авторами модулей программы.
6.Каждый урок проходит многоуровневое ревью — эксперта, методиста, редактора, студента-тестировщика.
7.Чередование форматов подачи информации (текст — видео— таблица).
8.Обязательно предоставление ссылок на дополнительные источники — документацию и полезные статьи, которые помогут лучше понять тему и расширят кругозор студента
9.В конце каждой темы у нас есть:
-итоговое тестирование, чтобы привести знания теории всистему, большая практическая задача для закрепления всех необходимых навыков модуля.
10.Обработка обратной связи от студентов по каждому модулю

Материалы курса

-Общие понятия ML
-Виды машинного обучения: обучение с учителем
-Виды машинного обучения: обучение без учителя
-Виды машинного обучения: обучение с подкреплением
-Процесс разработки
-Линейная регрессия: аналитическое решение
-Метрики регрессии. Недостатки аналитического решения
-Линейная регрессия: численное решение
-Дилемма смещения и разброса. Полиномиальные признаки. Регуляризация
-Логистическая регрессия
-Метрики классификации. Мультиклассовая классификация
-Логистическая регрессия. Практика
-Деревья решений
-Введение в ансамбли: бэггинг
-Введение в ансамбли: бустинг
-Введение в ансамбли: стекинг
-Деревья решений и ансамбли. Практика
-Задачи и подходы кластеризации
-Условия задач кластеризации
-Алгоритмы кластеризации
-K-means
-EM-алгоритм
-Агломеративная кластеризация
-DBSCAN
-Сравнение алгоритмов
-Оценка качества
-Коэффициент силуэта
-Однородность
-Полнота
-V-мера
-Кластеризация текстов
-Готовимся к собеседованию
-Разбиение выборки
-Метрики качества регрессии
-Метрики качества классификации
-Underfitting и overfitting
-Дисбаланс выборки
-Визуализация процесса обучения
-Способы представления данных
-Кодирование и преобразование признаков
-Масштабирование признаков
-Даты и расстояния
-Отбор признаков
-Базовая оптимизация
-Продвинутая оптимизация

Учебная литература

-Python для анализа данных / Маккини Уэс. - М.: ДМК Пресс, 2020 - 540 с. (ОПК-3)
Статистика и котики / Савельев В. - М.: АСТ, 2018. - 192 с. (ПК-2)
-Data Science: инсайдерская информация для новичков / О’Нил Кэти, Шатт Рэйчел. - СПб.: Питер, 2019 - 368. (ОПК-1)

Темы

Теория машинного обучения Регрессия Классификация Кластеризация и техники понижение размерности Валидация данных и оценка модели Отбор и селекция признаков Оптимизация гиперпараметров модели ML Cookbook Проект 3. Задача классификации
Лекции
2,00ч
Практические занятия
4,00ч
Самостоятельная работа
4,00ч
Всего
10,00ч
Лекции
1,00ч
Практические занятия
3,00ч
Самостоятельная работа
2,00ч
Всего
6,00ч
Лекции
1,00ч
Практические занятия
6,00ч
Самостоятельная работа
3,00ч
Всего
10,00ч
Лекции
1,00ч
Практические занятия
6,00ч
Самостоятельная работа
3,00ч
Всего
10,00ч
Лекции
1,00ч
Практические занятия
4,00ч
Самостоятельная работа
4,00ч
Всего
9,00ч
Лекции
1,00ч
Практические занятия
3,00ч
Самостоятельная работа
4,00ч
Всего
8,00ч
Лекции
1,00ч
Практические занятия
4,00ч
Самостоятельная работа
5,00ч
Всего
10,00ч
Лекции
1,00ч
Практические занятия
3,00ч
Самостоятельная работа
2,00ч
Всего
6,00ч
Лекции
2,00ч
Практические занятия
5,00ч
Самостоятельная работа
9,00ч
Всего
16,00ч
Промежуточная аттестация 8,00 часов
Выполнение тестовых заданий