Модуль 4
82,00ч

Машинное обучение

Модуль ориентирован на изучение и овладение программным инструментарием Data Mining и Machine Learning, технологиями кластеризации и классификации, методами оптимизации машинного обучения на больших данных, программами рекомендательных систем.
Вы углубите свои знания и умения в области машинного обучения на больших данных
Часов в программе
19,00 часов
лекции
44,00 часа
практика
19,00 часов
самостоятельная
82,00 часа
всего
Материально-технические условия реализации программы:
Вид занятий: Лекционные занятия
Требуемое ПО:
веб-браузеры Google Chrome, Mozila Firefox, Opera, Microsoft Edge, Яндекс.Браузер и др.
Вид занятий: Практические занятия, самостоятельная работа
Требуемое ПО:
веб-браузеры Google Chrome, Mozila Firefox, Opera, Microsoft Edge, Яндекс.Браузер и др.
Anaconda 2.7 или 3.5
Доступ к облачным вычислительным ресурсам.
Информационные ресуры
1. https://ai.2035.university/ - сайт УНТИ 2035 «Обучение в области искусственного интеллекта»
2. https://xn--80aapampemcchfmo7a3c9ehj.xn--p1ai/projects/tsifrovaya-ekonomika - сайт Национального проекта «Цифровая экономика»
3. https://xn--80aapampemcchfmo7a3c9ehj.xn--p1ai/projects/tsifrovaya-ekonomika/p-iskusstvennyy-intellekt-p – сайт федерального проекта «Искусственный интеллект» Национального проекта «Цифровая экономика»
4. https://sprint.1t.ru/ - сайт образовательной платформы ООО «1Т»
5. https://trends.rbc.ru/trends/tag/ai - раздел «Искусственный интеллект» на сайте РБК.
6. https://www.tadviser.ru/index.php/%D0%9F%D1%80%D0%BE%D0%B4%D1%83%D0%BA%D1%82:%D0%98%D1%81%D0%BA%D1%83%D1%81%D1%81%D1%82%D0%B2%D0%B5%D0%BD%D0%BD%D1%8B%D0%B9_%D0%B8%D0%BD%D1%82%D0%B5%D0%BB%D0%BB%D0%B5%D0%BA%D1%82_(%D0%98%D0%98,_Artificial_intelligence,_AI) – раздел «Искусственный интеллект» на сайте «TAdviser». Государство. Бизнес. Технологии.
7. https://rb.ru/opinion/inzhener-dannyh/ - «Инженер данных: что это за специалист и как им стать?» на сайте - RB.RU
8. https://rb.ru/opinion/data-engineer-modeli-data-scientist/ - «В России катастрофически не хватает инженеров данных – кому и зачем они нужны» на сайте - RB.RU
Образовательные ресуры
1. Воронцов К. В. Машинное обучение: курс лекций // MachineLearning.ru. - URL: http://www.recognition.su/wiki/index.php?title=Машинное_обучение_(курс_лекций%2C_К.В.Воронцов).
2. Бесплатные материалы по Data Engineering от преподавателей МФТИ https://fpmi-edu.ru/free-de
3. https://ru.coursera.org/specializations/gcp-data-machine-learning#courses
4. Big Data Specialization. https://www.coursera.org/specializations/big-data
5. https://stepik.org/course/101687/promo
6. Курс «Big Data от Sergey Petrovich» https://www.youtube.com/playlist?list=PL15mR4o-R9Ng3Fh8Z2HpLdQeJQHSoNKcp
7. https://mlcourse.ai/book/index.html
8. Распределенные компьютерные системы. https://www.youtube.com/watch?v=w8KFPWkK0bI&list=PLawkBQ15NDEkDJ5IyLIJUTZ1rRM9YQq6N&index=3

Учебно-методические материалы

Методы, формы и технологии

Для достижения планируемых результатов обучение строится с использованием следующих:
методов: case-study, метод проектов, модульное обучение, проблемное обучение, контекстное обучение;
форм: лекции с использованием мультимедиа, практические занятия, самостоятельная работа, практика на базе привлекаемой организации.

Кроме того, обучение строится с применением технологий электронного обучения
и дистанционных образовательных технологий.

Методические разработки

Обучающие материалы представлены в виде видеолекций, текстовых и графических материалов, размещенных на платформе sprint.1T.

Материалы курса

Видеолекции
Текстовые материалы лекций
Инструкции для выполнения заданий
Обучающие задания с автоматизированной системой проверки и подсказками
Проверочные задания с автоматизированной системой проверки

Учебная литература

1. Машинное обучение с использованием Python. Сборник рецептов: Пер. с англ. Front Cover. Элбон Крис. БХВ-Петербург, 2020. − 384 с. ISBN 978-5-9775-4056-8.
2. Пратик Джоши. Искусственный интеллект с примерами на Python. – Диалектика, 2019. – 448 с. ISBN 978-5-907114-41-8.
3. Джон Д. Келлехер, Брайан Мак-Нейми, Аоифе д’Арси. Основы машинного обучения для аналитического прогнозирования: алгоритмы, рабочие примеры и темати­ческие исследования. – Диалектика-Вильямс, 2019 – 656 с. ISBN: 978-5-6040044-9-4.
4. Дэви Силен, Арно Мейсман, Мохамед Али. Основы Data Science и Big Data. Python и наука о данных. – СПб.: Питер, 2017 – 336 с.: ил – (Серия «Библиотека программиста»). ISBN 978-5-496-02517-1.
5. Бурков А. Машинное обучение без лишних слов. Изд-во: Питер, 2020 – 192 с. ISBN 978-5-4461-1560-0.
6. Кухарев Г. А. Методы обработки и распознавания изображений лиц в задачах биометрии / Г. А. Кухарев, Е. И. Каменская, Ю. Н. Матвеев, Н. Л. Щеголева. Монография СПб: Политехника, 2013. − 388 с.
7. Вьюгин В. В. Математические основы теории машинного обучения и прогнозирования. – М. : МЦНМО, 2013. – 387 с.
8. Каклаускас А., Завадскас Э.-К. Биометрическая и интеллектуальная поддержка решений: монография. Вильнюс: Техника, 2012. – С. 344.
9. Неделько В. М. Основы статистических методов машинного обучения : учеб. пособие. – Новосибирск : Новосиб. гос. техн. ун-т, 2010. – 79 с.
10. Методы одномерной оптимизации: метод. указания / сост. И.А. Власова – Самара, 2015. –90 с.: ил.
11. Попова Т.М. Методы безусловной оптимизации : Тексты лекций. / Т. М. Попова; [науч. ред. Р. В. Намм]. - Хабаровск: Изд-во Тихоокеан. гос. ун-та, 2013. – 76 с.
ISBN 987-5-7389-1245-0.
12. Бирюков А. Г. Методы оптимизации. Условия оптимальности в экстремальных задачах : учеб. пособие для вузов (направление «Прикладные мат. и физика») /
Бирюков Александр Гаврилович. – Москва : МФТИ, 2010. – 226 с.
13. Щетинин, Е.Ю. Математические методы оптимизации и оптимальных процессов : учебное пособие / Е.Ю. Щетинин. – Москва : СТАНКИН, 2015.
14. Сухарев, А. Г. Курс методов оптимизации : учебное пособие / А. Г. Сухарев, А. В. Тимохов, В. В. Федоров. – 2-е изд. – Москва : Физматлит, 2011. – 368 с. –
ISBN 978-5-9221-0559-0.

Темы

Тема 4.1 Введение в машинное обучение и обработку данных. Тема 4.2 Основной аппарат комбинаторики и мат. статистики. Регрессионный анализ и сжатие данных. Тема 4.3 Технологии кластеризации и классификации. Деревья решений. Нейронные сети. Генетические алгоритмы. Тема 4.4 Деревья решений Тема 4.5 Методы оптимизации машинного обучения Тема 4.6 GPU в задачах машинного обучения Тема 4.7 Машинное обучение на больших данных. Онлайн обучение и линейные модели Тема 4.8 Рекомендательные системы Тема 4.9 Нейронные сети Тема 4.10 LSH. Кластеризация больших данных
Лекции
2,00ч
Практические занятия
4,00ч
Самостоятельная работа
2,00ч
Всего
8,00ч
Лекции
2,00ч
Практические занятия
4,00ч
Самостоятельная работа
2,00ч
Всего
8,00ч
Лекции
2,00ч
Практические занятия
6,00ч
Самостоятельная работа
2,00ч
Всего
10,00ч
Лекции
2,00ч
Практические занятия
4,00ч
Самостоятельная работа
2,00ч
Всего
8,00ч
Лекции
2,00ч
Практические занятия
6,00ч
Самостоятельная работа
1,00ч
Всего
9,00ч
Лекции
1,00ч
Практические занятия
2,00ч
Самостоятельная работа
2,00ч
Всего
5,00ч
Лекции
2,00ч
Практические занятия
4,00ч
Самостоятельная работа
2,00ч
Всего
8,00ч
Лекции
2,00ч
Практические занятия
6,00ч
Самостоятельная работа
2,00ч
Всего
10,00ч
Лекции
2,00ч
Практические занятия
4,00ч
Самостоятельная работа
2,00ч
Всего
8,00ч
Лекции
2,00ч
Практические занятия
4,00ч
Самостоятельная работа
2,00ч
Всего
8,00ч