Модуль 4
95,00ч

Машинное обучение для больших объёмов данных

Изучите основы структурированного языка запросов SQL и операции реляционной алгебры. Познакомитесь с PostgreSQL — популярной системой управления базами данных (СУБД). Научитесь писать запросы разного уровня сложности и переводить бизнес-задачи на язык SQL. Также вы познакомитесь с PySpark — библиотекой для распределённой обработки больших объёмов данных. Научитесь решать простые задачи компьютерного зрения с привлечением готовых нейронных сетей и библиотеки Keras. Познакомитесь с Deep learning и обучением без учителя, задачами кластеризации и поиска аномалий.
Часов в программе
25,00 часов
лекции
50,00 часов
практика
20,00 часов
промежуточная аттестация
95,00 часов
всего
Материально-технические условия реализации программы:
Вид занятий: Работа в интерактивной онлайн-среде Яндекса
Требуемое ПО:
Google Docs, Google Sheets, MS Office, браузер Google Chrome и/или Яндекс.Браузер,

Учебно-методические материалы

Методы, формы и технологии

Онлайн-тренажёр и интерактивный учебник на LMS Яндекс.Практикума, Практические задания, самостоятельная работа, вебинары и Q&A сессии с наставниками и экспертами курса.

Методические разработки

Тесты, презентации, чек-листы, инструкции практические задания.

Материалы курса

Все материалы расположены в интерактивном учебнике в LMS Яндекс.Практикума

Учебная литература

Большая часть источников для нашей программы — это авторские материалы. Более 100 экспертов, задействованных в разработке и оперировании курса. Также мы следим и постоянно обновляем информацию о технологиях и методах внутри интерактивного учебника. В личном кабинете студента есть также список дополнительной литературы в темам курса.

Темы

Тема 1. Базовый SQL Тема 2. Командная строка и Git Тема 3. Мастерская Тема 4. Системы обработки больших данных
Лекции
10,00ч
Практические занятия
15,00ч
Всего
25,00ч
Практические занятия
5,00ч
Всего
5,00ч
Практические занятия
30,00ч
Всего
30,00ч
Лекции
15,00ч
Всего
15,00ч
Промежуточная аттестация 20,00 часов
Проект: SQL в анализе данных и машинном обучении
Проект: Командная строка/Git
Проект: Системы обработки больших данных