Технологии анализа данных
Федеральное государственное автономное образовательное учреждение высшего образования «Национальный исследовательский университет ИТМО»Описание
Программа посвящена технологиям работы с большими объемами данных. Слушатели изучат алгоритмы и структуры данных на Python, узнают, какие есть билиотеки для работы с данными и как использовать их потенциал. Мы научим работать с данными различной структуры - начиная с разведочного анализа данных, визуализации и описательных статистик до хранения данных большого объема. Вы изучите алгоритмы машинного обучения, узнаете о том, для решения каких прикладных задач они подходят и как настраивать параметры методов.
Первая часть курса дает базовые навыки в первичной обработке и хранении данных. Вы научитесь навыкам программирования на Python, обрабатывать данные в электронных таблицах, применять правильные методы визуализации данных и выявлять тренды во временных рядах, применять специальные программные средства для организации хранения и работы с большими объемами сложно структурированных данных. В курсе будут рассмотрены примеры промышленных реляционных СУБД и NoSQL хранилищ.
Вторая часть курса дает базовые навыки применения методов машинного обучения и искусственного интеллекта к интеллектуальному анализу данных. Вы узнаете, какие задачи решает машинное обучение, познакомитесь с методами решении задач обучения с учителем: регрессии и классификации, обучения без учителя: кластеризации, узнаете, что такое ансамбли моделей и обучение с подкреплением.
Курс не требует специальных начальных навыков, доступен тем, кто является пользователем ПК, имеет навык работы с операционной системой Windows, владеет пакетом офисных программ, умеет искать информацию в сети Internet. Навыки программирования желательны, но необязательны. Курс носит практикоориентированный характер. В качестве упражнений пользователи будут обрабатывать наборы данных при помощи инструментов: электронных таблиц, реляционных СУБД и NoSQL хранилищ, библиотек языка программирования Python, а также облачного инструмента Azure ML Studio. Для работы с курсом требуется компьютер с выходом в интернет. Для выполнения упражнений не потребуется установка программных средств на свой компьютер, все рекомендуемые в курсе инструменты доступны удаленно.
Часов в программе
Цель программы
Актуальность
Любая современная компания, от кофейни на углу до крупной производственной организации, имеет задачи, связанные с данными. Работая с ними, аналитик не просто собирает информацию.
Он визуализирует данные, ищет в них закономерности, выявляет проблемные места, выдвигает гипотезы и предлагает оптимальные решения для улучшения бизнес-процессов.
Аналитик данных — ключевой игрок цифровой экономики.
Входная диагностика 1 час
Задания входной диагностики доступны по ссылке: https://docs.google.com/forms/d/1YFqjO2nb69QUN5ja_e26NZqAMhGbt0rGrm4vmSUVGCE/edit
Итоговая аттестация 8 часов
Компетенции
Общекультурные
Владает культурой работы с данными
терминология в области данных, источники данных, критерии проверки и улучшения качества данных, области применения анализа данных, описательные статистики
Уметь:умение находить необходимые данные, работать с различными форматами, преобразование данных
Владеть:владение электронными таблицами, в том числе регулярными выражениями и сводными таблицами, владеет методами визуализации данных
Общепрофессиональные
Владеет навыками программирование на языке Python
знание синтаксиса языка Python, конструкций для реализации алгоритмов
Уметь:умение создавать программный код на языке Python, ипользование библиотек
Владеть:использование Jupyter Notebooks и библиотек для реализации алгоритмов на языке Python
Профессиональные
Владеет навыками работы с реляционными СУБД
проектирование данных в реляционной среде, знание принципов построения структур хранения данных и правил целостности, понимание дополнительных структур для оптимизации работы с данными, знание языка SQL и его процедурных расширений
Уметь:создание объектов базы данных: таблиц, индексов, процедур и функций с помощью языка SQL и его процедурных расширений, формирование запросов к данным
Владеть:Проектирование и создание объектов базы данных в среде Oracle Apex, PostgreSQL
Владеет навыками работы с NoSQL хранилищами
проектирование данных в терминах NoSQL хранилищ, знание принципов построения структур хранения данных и правил целостности, понимание дополнительных структур для оптимизации работы с данными, знание языка манипулирования данными в хранилище
Уметь:создание объектов хранилища, формирование запросов к данным
Владеть:Проектирование, создание объектов базы данных и построение запросов в средах Redis, MongoDb, Cassandra, Neo4j.
Владеет методами машинного обучения для интеллектуального анализа данных
Знает основных задачи машинного обучения и методы их решения
Уметь:Умеет применять подходящие инструменты для решения задач машинного обучения
Владеть:Владеет концепцией алгоритмов решения задач машинного обучения
Требования
Образование
- Высшее образование
- Среднее профессиональное образование
Модули
свернутьПреподаватели
Бойцев
Антон Александрович
Федеральное государственное автономное образовательное учреждение высшего образования «Национальный исследовательский университет ИТМО»
ординарный доцент
к.ф.-м.н.
https://itmo.ru/ru/viewperson/1546/boycev_anton_aleksandrovich.htmВолчек
Дмитрий Геннадьевич
Федеральное государственное автономное образовательное учреждение высшего образования «Национальный исследовательский университет ИТМО»
доцент Высшей школы цифровой
к.т.н.
https://itmo.ru/ru/viewperson/1547/volchek_dmitriy_gennadevich.htmГрафеева
Наталья Генриховна
Федеральное государственное автономное образовательное учреждение высшего образования «Национальный исследовательский университет ИТМО»
доцент Высшей школы цифровой культуры
к.ф.-м.н.
доцент
https://itmo.ru/ru/viewperson/1548/grafeeva_natalya_genrihovna.htmЕгорова
Ольга Борисовна
Федеральное государственное автономное образовательное учреждение высшего образования «Национальный исследовательский университет ИТМО»
преподаватель Высшей школы цифровой культуры университета ИТМО
к.фил.н.
https://itmo.ru/ru/viewperson/1545/egorova_olga_borisovna.htmМихайлова
Елена Георгиевна
Федеральное государственное автономное образовательное учреждение высшего образования «Национальный исследовательский университет ИТМО»
директор Высшей школы цифровой культуры университета ИТМО
к.ф.-м.н.
доцент
https://itmo.ru/ru/viewperson/1399/mihaylova_elena_georgievna.htmРоманов
Алексей Андреевич
Федеральное государственное автономное образовательное учреждение высшего образования «Национальный исследовательский университет ИТМО»
доцент Высшей школы цифровой культуры университета ИТМО
к.т.н.
https://itmo.ru/ru/viewperson/1544/romanov_aleksey_andreevich.htmУказана полная стоимость. Вы сможете получить скидку на этот курс от 50% до 100% по проекту «Цифровые профессии» в зависимости от льготной категории.
Авторизуйтесь чтобы записатьсяПрофстандарт
ФЕДЕРАЛЬНЫЙ ГОСУДАРСТВЕННЫЙ ОБРАЗОВАТЕЛЬНЫЙ СТАНДАРТ ВЫСШЕГО ОБРАЗОВАНИЯ - МАГИСТРАТУРА ПО НАПРАВЛЕНИЮ ПОДГОТОВКИ 02.04.03 МАТЕМАТИЧЕСКОЕ ОБЕСПЕЧЕНИЕ И АДМИНИСТРИРОВАНИЕ ИНФОРМАЦИОННЫХ СИСТЕМ
06.042Ответственный за программу
+79219979791