Модуль 2

Базовые задачи и методы машинного обучения.

Модуль 2. Базовые задачи и методы машинного обучения (22 часа)
Тема 2.1 Этапы и основные задачи анализа данных (6 часов)
Этапы анализа данных. Виды признаков. Анализ данных и машинное обучение. Обучение с учителем, без учителя, с подкреплением. Основные задачи машинного обучения. Принципы оценки качества моделей машинного обучения. Библиотека SkLearn.
Тема 2.2 Задача регрессии, основные методы и оценка качества моделей (6 часов)
Задача регрессии. Линейная и полиномиальная регрессия. Функции ошибок. Переобучение и регуляризация.
Тема 2.3 Задача классификации, базовые методы, оценка качества, ансамблевые методы (8 часов)
Задача классификации. Метрики качества классификации. Метод к ближайших соседей. Логистическая регрессия. Метод опорных векторов. Решающие деревья. Ансамблевые методы. Случайный лес. Градиентный бустинг. Подбор оптимальных гиперпараметров.
Тема 2.4 Задача кластеризации, основные методы и оценка качества (6 часов)
Задача кластеризации. Метрики кластеризации. Метод к-средних. Метод DBSCAN. Метод t-SNE.