Аналитика данных и машинное обучение
Университет ИннополисОписание
Данные — это объемные массивы сведений о деятельности компании. Аналитический подход помогает выявлять закономерности по различным критериям и извлекать информацию из данных.
Образовательная программа направлена на получение навыков создания моделей машинного обучения. Программа включает в себя темы по проверке статистических гипотез, применения методов кластеризации, метрик для оценки качества результатов анализа данных и др.
Курс проходит в дистанционном формате, поэтому присоединиться к занятиям можно из любого города или региона. Слушатели получают обратную связь к выполненным домашним заданиям. Это позволит лучше разобраться в материалах курса и быстрее усвоить новую информацию. В конце участники выполняют учебный проект.
Кому подойдет программа:
— начинающим аналитикам и ИТ-специалистам;
— студентам ИТ-направлений;
— специалистам, желающим сменить сферу деятельности.
Чему вы научитесь:
— основам языка программирования Python;
— обрабатывать данные с помощью библиотек NumPy, Pandas, Matplotlib и Sklearn;
— владеть методами машинного обучения;
— оценивать качество моделей;
— применять статистические методы для проверки гипотез.
Часов в программе
Цель программы
Актуальность
По причине повышенного спроса на ИТ-специалистов аналитики больших данных считаются одними из самых востребованных. Универсальность Python заключается в простоте синтаксиса и относительной легкости в изучении. На курсе узнаете, как использовать язык программирования Python и связанные с ним приложения для работы с большими данными и создания моделей машинного обучения.
Итоговая аттестация 4 часа
Компетенции
Профессиональные
Способен использовать инструментальные средства для решения задач машинного обучения
• типы анализа больших данных, виды аналитики;
• теоретические и прикладные основы анализа больших данных;
• методы и инструментальные средства управления аналитическими проектами по исследованию больших данных;
• методы разработки алгоритмов и программного обеспечения в рамках систем искусственного интеллекта;
• современные методы и инструментальные средства анализа больших данных;
• технологии анализа данных: статистический анализ, семантический анализ, анализ изображений, машинное обучение, методы сравнения средних, частотный анализ, анализ соответствий, кластерный анализ, дискриминантный анализ, факторный анализ, деревья классификации, многомерное шкалирование, моделирование структурными уравнениями, методы анализа выживаемости, временные ряды, планирование экспериментов, карты контроля качества;
• нейронные сети: полносвязные, свёрточные и рекуррентные нейронные сети, методы обучения нейронных сетей, нейросетевые методы понижения размерности;
• статистические модели;
• алгоритмы машинного обучения: обучение с учителем, обучение без учителя, полууправляемое обучение, обучение с подкреплением;
• машинное обучение: классификация, кластеризация, обнаружение выбросов, фильтрация;
• распределенный анализ данных;
• анализ данных в реальном времени;
• методы обучения с учителем: метрические методы классификации, метод линейной регрессии, байесовские методы, подходы к регуляризации (L1, L2);
• математический анализ, теория вероятности и математическая статистика.
• осуществлять оценку и выбор инструментальных средств для решения поставленной задачи;
• разрабатывать модели машинного обучения для решения задач;
• планировать и проводить аналитические работы с использованием технологий больших данных;
• проводить анализ больших данных;
• осуществлять интеграцию и преобразование данных в ходе работ по анализу больших данных;
• программировать на языках высокого уровня, ориентированных на работу с большими данными: для статистической обработки данных и работы с графикой, для работы с разрозненными фрагментами данных в больших массивах, для работы с базами структурированных и неструктурированных данных;
• решать задачи классификации, кластеризации, регрессии, прогнозирования, снижения размерности и ранжирования данных;
• работать с библиотеками numpy, pandas, matplotlib, seaborn;
• работать с операционной системой Linux.
• использования методов кластеризации;
• разработки нейронных сетей на языке Python;
• разработки методов машинного обучения с учителем на языке Python;
• эффективной работы с данными;
• построения предиктивных моделей;
• написания и оптимизации алгоритмов машинного обучения;
• визуализации полученных результатов;
• проведении статистической проверки гипотез по имеющимся данным.
Владение технологиями:
● Python, Pandas, Numpy
● Pytorch / Tensorflow / Keras
● OpenCV, NLTK, SpaCy, Natasha, платформа nvidia jetson nano
● Google Colaboratory, Docker, Flask / Django
Требования
При поступлении на Программу слушатель должен обладать знаниями основ программирования и прикладной математики.
Образование
- Высшее образование
- Среднее профессиональное образование
Иные требования и рекомендации для обучения по программе
При поступлении на Программу слушатель должен обладать знаниями основ программирования и прикладной математики.
Модули
свернутьПреподаватели
Бурмяков
Артем Сергеевич
Университет Иннополис
доцент Лаборатории облачных систем и технологий виртуализации Института информационной безопасности
Доктор наук
доцент
Зуев
Евгений Александрович
Университет Иннополис
руководитель Лаборатории операционных систем, языков программирования и компиляторов Института разработки ПО и программной инженерии
кандидат физико-математических наук
профессор
Иванов
Владимир Владимирович
Университет Иннополис
доцент, руководитель Лаборатории методов обработки естественного языка в программной инженерии Института разработки ПО и программной инженерии
кандидат физико-математических наук
доцент
Кладько
Сергей Сергеевич
Университет Иннополис
доцент лаборатории гуманитарных наук Института гуманитарных и социальных наук
кандидат философских наук
доцент
Конюхов
Иван Владимирович
Университет Иннополис
доцент Лаборатории анализа данных и машинного обучения в нефтегазовой отрасли Института анализа данных и искусственного интеллекта
кандидат физико-математических наук
доцент
Круглов
Артём Васильевич
Университет Иннополис
доцент факультета компьютерных наук и программной инженерии
кандидат технических наук
доцент
Кулеев
Рамиль Фуатович
Университет Иннополис
Руководитель Лаборатории искусственного интеллекта, Директор Института искусственного интеллекта, Директор Исследовательского центра в сфере искусственного интеллекта
кандидат технических наук
Лукманов
Рустам Абубакирович
Университет Иннополис
доцент Лаборатории анализа данных и машинного обучения в нефтегазовой отрасли Института анализа данных и искусственного интеллекта
Садовых
Андрей Александрович
Университет Иннополис
доцент Лаборатории промышленной разработки ПО Института разработки ПО и программной инженерии
доктор наук
доцент
Сейтназаров
Шынназар Оралбаевич
Университет Иннополис
доцент Лаборатории облачных систем и технологий виртуализации Института информационной безопасности и киберфизических систем
кандидат наук
доцент
Суччи
Джианкарло
Университет Иннополис
профессор, декан Факультета компьютерных и инженерных наук Института разработки ПО и программной инженерии
доктор наук
профессор
Фарина
Мирко
Университет Иннополис
доцент, заведующий лабораторией взаимодействия человека и машины Института гуманитарных и социальных наук
кандидат наук
доцент
Аслам
Хамна
Университет Иннополис
научный сотрудник, исследователь и преподаватель Лаборатории искусственного интеллекта в разработке игр
Хан
Адил Мехмуд
Университет Иннополис
профессор, начальник Лаборатории машинного обучения и представления данных Института анализа данных и искусственного интеллекта
кандидат наук
профессор
Холодов
Ярослав Александрович
Университет Иннополис
профессор, руководитель Лаборатории анализа данных и биоинформатики Института анализа данных и искусственного интеллекта
доктор физико-математических наук
профессор
Чианкарини
Паоло
Университет Иннополис
профессор Института анализа данных и искусственного интеллекта
доктор наук
профессор
Шилов
Николай Вячеславович
Университет Иннополис
доцент Института разработки ПО и программной инженерии, руководитель Лаборатории программной инженерии
кандидат физико-математических наук
доцент
Хузиев
Айрат Айдарович
Университет Иннополис
системный аналитик Лаборатории развития продукта в сфере искусственного интеллекта в промышленности
Профстандарт
Специалист по большим данным
06.042Специальность
Аналитик данных (Data Scientist)
Отрасль
Промышленность
Ответственный за программу
+78002229256