Модуль 1

Основы машинного обучения и анализа данных

Тема 1.1 Задачи машинного обучения и анализа данных
Машинное обучение. Задачи машинного обучения. Сферы применения. Обучение с учителем. Обучение без учителя. Наборы данных для обучения с учителем.
Тема 1.2 Формирование наборов данных. Линейная регрессия.
Обучающая и тестовая выборка. Работа с данными в математических пакетах и в Python. Визуализация данных. Задача парной линейной регрессии. Матрицы и векторы. Производная. Метод градиентного спуска.
Тема 1.3 Множественная регрессия. Масштабирование. Нормальное уравнение
Множественная линейная регрессия. Проблема разного масштаба факторов. Градиентный спуск. Векторизация расчётов. Нормальное уравнение и его область применения.
Тема 1.4 Классификация. Логистическая регрессия. Граница решения.
Задача классификации. Бинарная классификация и логистическая регрессия. Граница решения классификатора. Нелинейные гипотезы.
Тема 1.5 Сложные гипотезы. Нейронные сети.
Проблемы построения гипотез по изображениям. Сложность гипотез. Нейронная сеть: принципы построения, формируемая гипотеза. Метод обратного распространения ошибки.
Тема 1.6. Оценка гипотез. Борьба с недо- и переобучением.
Недообучение и переобучение: их признаки, влияние на модель. Оценка гипотез. Обучающая, тестовая и рабочая выборки. Методы борьбы с недообучением и переобучением.
Тема 1.7 Обучение без учителя. Кластеризация.
Задача кластеризации. Метод k-средних. Область применения.
Тема 1.8 Построение рекомендаций.
Задача построения рекомендаций по содержимому в системах электронной торговли и доставки содержимого. Вывод рекомендаций и обновление данных. Проблема «холодного старта» и способы её решения.