III уровень Большие данные

Аналитика данных и машинное обучение

Университет Иннополис
256 часов длительность
Онлайн формат
Базовый уровень
1 поток (закрыт) 01.06-27.11.2023
2 поток (закрыт) 07.06-27.11.2023
3 поток (закрыт) 14.06-27.11.2023
4 поток (закрыт) 23.06-27.11.2023

Описание

Данные — это объемные массивы сведений о деятельности компании. Аналитический подход помогает выявлять закономерности по различным критериям и извлекать информацию из данных.

Образовательная программа направлена на получение навыков создания моделей машинного обучения. Программа включает в себя темы по проверке статистических гипотез, применения методов кластеризации, метрик для оценки качества результатов анализа данных и др. 

Курс проходит в дистанционном формате, поэтому присоединиться к занятиям можно из любого города или региона. Слушатели получают обратную связь к выполненным домашним заданиям. Это позволит лучше разобраться в материалах курса и быстрее усвоить новую информацию. В конце участники выполняют учебный проект.

Кому подойдет программа:

— начинающим аналитикам и ИТ-специалистам;

— студентам ИТ-направлений;

— специалистам, желающим сменить сферу деятельности.

Чему вы научитесь:

— основам языка программирования Python;

— обрабатывать данные с помощью библиотек NumPy, Pandas, Matplotlib и Sklearn;

— владеть методами машинного обучения;

— оценивать качество моделей;

— применять статистические методы для проверки гипотез.

 

Часов в программе
55 часов
лекции
82 часа
практика
110 часов
самостоятельная
5 часов
промежуточная аттестация
4 часа
итоговая аттестация
256 часов
всего
Цель программы
Целью подготовки слушателей по Программе является совершенствование компетенций в области искусственного интеллекта и машинного обучения, необходимых для профессиональной деятельности по специальности аналитик данных.
Актуальность
Сведения о деятельности компании накапливаются в виде больших массивов данных. Их грамотный анализ и обработка при помощи профессиональных инструментов позволяет бизнесу анализировать поведение клиентов и спрос на товары.

По причине повышенного спроса на ИТ-специалистов аналитики больших данных считаются одними из самых востребованных. Универсальность Python заключается в простоте синтаксиса и относительной легкости в изучении. На курсе узнаете, как использовать язык программирования Python и связанные с ним приложения для работы с большими данными и создания моделей машинного обучения.
Итоговая аттестация 4 часа
защита проектной работы

Компетенции

Профессиональные


Способен использовать инструментальные средства для решения задач машинного обучения
Знать:

• типы анализа больших данных, виды аналитики;
• теоретические и прикладные основы анализа больших данных;
• методы и инструментальные средства управления аналитическими проектами по исследованию больших данных;
• методы разработки алгоритмов и программного обеспечения в рамках систем искусственного интеллекта;
• современные методы и инструментальные средства анализа больших данных;
• технологии анализа данных: статистический анализ, семантический анализ, анализ изображений, машинное обучение, методы сравнения средних, частотный анализ, анализ соответствий, кластерный анализ, дискриминантный анализ, факторный анализ, деревья классификации, многомерное шкалирование, моделирование структурными уравнениями, методы анализа выживаемости, временные ряды, планирование экспериментов, карты контроля качества;
• нейронные сети: полносвязные, свёрточные и рекуррентные нейронные сети, методы обучения нейронных сетей, нейросетевые методы понижения размерности;
• статистические модели;
• алгоритмы машинного обучения: обучение с учителем, обучение без учителя, полууправляемое обучение, обучение с подкреплением;
• машинное обучение: классификация, кластеризация, обнаружение выбросов, фильтрация;
• распределенный анализ данных;
• анализ данных в реальном времени;
• методы обучения с учителем: метрические методы классификации, метод линейной регрессии, байесовские методы, подходы к регуляризации (L1, L2);
• математический анализ, теория вероятности и математическая статистика.

Уметь:

• осуществлять оценку и выбор инструментальных средств для решения поставленной задачи;
• разрабатывать модели машинного обучения для решения задач;
• планировать и проводить аналитические работы с использованием технологий больших данных;
• проводить анализ больших данных;
• осуществлять интеграцию и преобразование данных в ходе работ по анализу больших данных;
• программировать на языках высокого уровня, ориентированных на работу с большими данными: для статистической обработки данных и работы с графикой, для работы с разрозненными фрагментами данных в больших массивах, для работы с базами структурированных и неструктурированных данных;
• решать задачи классификации, кластеризации, регрессии, прогнозирования, снижения размерности и ранжирования данных;
• работать с библиотеками numpy, pandas, matplotlib, seaborn;
• работать с операционной системой Linux.

Владеть:

• использования методов кластеризации;
• разработки нейронных сетей на языке Python;
• разработки методов машинного обучения с учителем на языке Python;
• эффективной работы с данными;
• построения предиктивных моделей;
• написания и оптимизации алгоритмов машинного обучения;
• визуализации полученных результатов;
• проведении статистической проверки гипотез по имеющимся данным.

Владение технологиями:
● Python, Pandas, Numpy
● Pytorch / Tensorflow / Keras
● OpenCV, NLTK, SpaCy, Natasha, платформа nvidia jetson nano
● Google Colaboratory, Docker, Flask / Django

Требования

При поступлении на Программу слушатель должен обладать знаниями основ программирования и прикладной математики.

Образование
  • Высшее образование
  • Среднее профессиональное образование
Иные требования и рекомендации для обучения по программе

При поступлении на Программу слушатель должен обладать знаниями основ программирования и прикладной математики.

Модули

свернуть
106ч
Модуль 1 Машинное обучение
Технологии для обработки данных Простейшие алгоритмы машинного обучения Кластерный анализ Алгоритмы бустинга и бэкинга
17ч
Модуль 3 Проектная работа
Разработка и тестирование приложения, с применением искусственного интеллекта.
129ч
Модуль 2 Нейронные сети и алгоритмы глубокого обучения. Применение искусственного интеллекта в обработке текста и цифровых изображений
Нейронные сети Использование Машиного обучения на предприятии Аналитика больших данных Обработка естественного языка Алгоритмы компьютерного зрения Промежуточная аттестация
106ч
Модуль 1 Машинное обучение
Технологии для обработки данных Простейшие алгоритмы машинного обучения Кластерный анализ Алгоритмы бустинга и бэкинга
129ч
Модуль 2 Нейронные сети и алгоритмы глубокого обучения. Применение искусственного интеллекта в обработке текста и цифровых изображений
Нейронные сети Использование Машиного обучения на предприятии Аналитика больших данных Обработка естественного языка Алгоритмы компьютерного зрения Промежуточная аттестация
17ч
Модуль 3 Проектная работа
Разработка и тестирование приложения, с применением искусственного интеллекта.

Преподаватели

Бурмяков

Артем Сергеевич

Университет Иннополис

доцент Лаборатории облачных систем и технологий виртуализации Института информационной безопасности

Доктор наук

доцент

Зуев

Евгений Александрович

Университет Иннополис

руководитель Лаборатории операционных систем, языков программирования и компиляторов Института разработки ПО и программной инженерии

кандидат физико-математических наук

профессор

Иванов

Владимир Владимирович

Университет Иннополис

доцент, руководитель Лаборатории методов обработки естественного языка в программной инженерии Института разработки ПО и программной инженерии

кандидат физико-математических наук

доцент

Кладько

Сергей Сергеевич

Университет Иннополис

доцент лаборатории гуманитарных наук Института гуманитарных и социальных наук

кандидат философских наук

доцент

Конюхов

Иван Владимирович

Университет Иннополис

доцент Лаборатории анализа данных и машинного обучения в нефтегазовой отрасли Института анализа данных и искусственного интеллекта

кандидат физико-математических наук

доцент

Круглов

Артём Васильевич

Университет Иннополис

доцент факультета компьютерных наук и программной инженерии

кандидат технических наук

доцент

Кулеев

Рамиль Фуатович

Университет Иннополис

Руководитель Лаборатории искусственного интеллекта, Директор Института искусственного интеллекта, Директор Исследовательского центра в сфере искусственного интеллекта

кандидат технических наук

Лукманов

Рустам Абубакирович

Университет Иннополис

доцент Лаборатории анализа данных и машинного обучения в нефтегазовой отрасли Института анализа данных и искусственного интеллекта

Садовых

Андрей Александрович

Университет Иннополис

доцент Лаборатории промышленной разработки ПО Института разработки ПО и программной инженерии

доктор наук

доцент

Сейтназаров

Шынназар Оралбаевич

Университет Иннополис

доцент Лаборатории облачных систем и технологий виртуализации Института информационной безопасности и киберфизических систем

кандидат наук

доцент

Суччи

Джианкарло

Университет Иннополис

профессор, декан Факультета компьютерных и инженерных наук Института разработки ПО и программной инженерии

доктор наук

профессор

Фарина

Мирко

Университет Иннополис

доцент, заведующий лабораторией взаимодействия человека и машины Института гуманитарных и социальных наук

кандидат наук

доцент

Аслам

Хамна

Университет Иннополис

научный сотрудник, исследователь и преподаватель Лаборатории искусственного интеллекта в разработке игр

Хан

Адил Мехмуд

Университет Иннополис

профессор, начальник Лаборатории машинного обучения и представления данных Института анализа данных и искусственного интеллекта

кандидат наук

профессор

Холодов

Ярослав Александрович

Университет Иннополис

профессор, руководитель Лаборатории анализа данных и биоинформатики Института анализа данных и искусственного интеллекта

доктор физико-математических наук

профессор

Чианкарини

Паоло

Университет Иннополис

профессор Института анализа данных и искусственного интеллекта

доктор наук

профессор

Шилов

Николай Вячеславович

Университет Иннополис

доцент Института разработки ПО и программной инженерии, руководитель Лаборатории программной инженерии

кандидат физико-математических наук

доцент

Хузиев

Айрат Айдарович

Университет Иннополис

системный аналитик Лаборатории развития продукта в сфере искусственного интеллекта в промышленности

Авторизуйтесь чтобы записаться

Профстандарт

Специалист по большим данным

06.042

Специальность

Аналитик данных (Data Scientist)

Отрасль

Промышленность

Ответственный за программу