Большие данные Визуализировать данные Seaborn NumPy Разрабатывать и создавать программы и приложения Matplotlib Анализировать данные Python Обрабатывать данные Pandas

«Data Science»

Университет Иннополис
256,00 часов длительность
Онлайн формат
Продвинутый уровень
1 поток (закрыт) 01.09-20.12.2021
2 поток (закрыт) 27.09-20.12.2021
3 поток (закрыт) 31.01-24.06.2022

Описание

Одна из самых востребованных на ИТ-рынке профессий — Data Scientist.

Специалист по большим данным применяет научные методы для анализа данных.

Курс направлен на подготовку специалистов по большим данным. Курс помогает приобрести навыки применения технологий больших данных на принципах машинного обучения, проводить  анализ больших данных.

В программе:

  • основы и алгоритмы машинного обучения
  • нейронные сети
  • кластеризация
  • распознавание лиц (компьютерное зрение)

Курс проходит в дистанционном формате, поэтому присоединиться к занятиям можно из любого города или региона. Вебинары проходят 2-3 раза в неделю. Слушатели получают обратную связь к выполненным домашним заданиям. Это позволит лучше разобраться в материалах курса и быстрее усвоить новую информацию. На практических занятиях слушатели попытаются самостоятельно разработать и протестировать приложения, основанные на машинном обучении.

Особенность онлайн-курса заключается в том, что особое внимание уделяется практическим знаниям. После каждого модуля слушатели проходят тесты и выполняют задачи. В конце обучения участники реализуют командные проекты.

Выдается диплом о профессиональной переподготовке установленного образца.

 

Часов в программе
52,00 часа
лекции
80,00 часов
практика
116,00 часов
самостоятельная
3,00 часа
промежуточная аттестация
1 час
входная диагностика
4 часа
итоговая аттестация
256,00 часов
всего
Цель программы
Получение компетенции, необходимой для выполнения нового вида профессиональной деятельности - создание и применение технологий больших данных на принципах машинного обучения; приобретение новой квалификации - специалист по машинному обучению.
Актуальность
Каждый год количество цифровых данных возрастает в несколько сотни раз. В связи с этим возрастает потребность в специалистах, которые могут упорядочить эти данные - Data Scientists. Основным подходом, который применяют специалисты в науке о данных является машинное обучение – набор методов и алгоритмов, которые позволяют найти неизвестные ранее закономерности и взаимосвязи. Помимо прогнозирования, актуальной задачей является поиск структуры во входящей информации, когда необходимо сгруппировать объекты по схожим параметрам. Такие процессы называются «кластеризацией». Упорядочить можно не только текстовые материалы или численные параметры, благодаря развитию искусственных нейронных сетей стало возможным распознавание изображений, или, следуя технической терминологии, «компьютерного зрения». Таким образом, специалисты по машинному обучению являются одной из самых востребованных профессий на сегодняшний день.
Данная программа обучения позволит обеспечить получение компетенции, необходимой для профессиональной деятельности Data Scientist, который, благодаря полученным знаниям и навыкам работы с большими данными, сможет выявить скрытые зависимости и тренды в потоке информации и обеспечить успешное развитие компании.
Входная диагностика 1 час
Тестирование
Итоговая аттестация 4 часа
защита выпускной аттестационной (квалификационной) работы- защита проектной работы

Компетенции

Профессиональные


Способность к планированию, организации, исследованию аналитических работ с использованием технологий больших данных.
Знать:

• методы и инструментальные средства управления аналитическими проектами по исследованию больших данных,
• типы анализа больших данных, виды аналитики,
• теоретические и прикладные основы анализа больших данных, • современный опыт использования анализа больших данных, • технологии анализа данных: статистический анализ, семантический
анализ, анализ изображений, машинное обучение, методы сравнения средних, частотный анализ, анализ соответствий, кластерный анализ, дискриминантный анализ, факторный анализ, деревья классификации, многомерное шкалирование, моделирование структурными уравнениями, методы анализа выживаемости, временные ряды, планирование экспериментов, карты контроля качества,
• нейронные сети: полносвязные, сверочные и рекуррентные нейронные сети, методы обучения нейронных сетей, нейросетевые методы понижения размерности,
• статистические модели,
• алгоритмы машинного обучения: обучение с учителем, обучение без учителя, полууправляемое обучение, обучение с подкреплением,
• машинное обучение: классификация, кластеризация, обнаружение выбросов, фильтрация,
• распределенный анализ данных,
• анализ данных в реальном времени,
• методы обучения с учителем: метрические методы классификации, метод линейной регрессии, байесовские методы, подходы к регуляризации (L1, L2),
• математический анализ, теория вероятности и математическая статистика.

Уметь:

• проводить аналитические работы с использованием технологий больших данных,
• проводить анализ больших данных,
• осуществлять интеграцию и преобразование данных в ходе работ по анализу больших данных,
• программировать на языках высокого уровня, ориентированных на работу с большими данными: для статистической обработки данных и работы с графикой, для работы с разрозненными фрагментами данных в больших массивах, для работы с базами структурированных и неструктурированных данных,
• решать задачи классификации, кластеризации, регрессии, прогнозирования, снижения размерности и ранжирования данных, • работать с библиотеками numpy, pandas, matplotlib, seaborn, • работать с операционной системой Linux.

Владеть:

• использования методов кластеризации,
• разработки нейронных сетей на языке Python,
• разработки методов машинного обучения с учителем на языке Python,
• эффективной работы с данными,
• построения предиктивных моделей,
• написания и оптимизации алгоритмов машинного обучения, • визуализации полученных результатов,
• разработки приложений на основе фреймворка Flask,
• проведении статистической проверки гипотез по имеющимся данным.

Требования

Нет

Образование
  • Высшее образование
  • Среднее профессиональное образование
Опыт профессиональной дятельности
Знания прикладной математики, базовые знания Python.
Предварительное освоение иных дисциплин/курсов /модулей
Будет преимуществом

Модули

свернуть
104,00ч
Модуль 1 Модуль 1. «Основы машинного обучения»
Темы модуля: 1.1. Технологии для Data Science 1.2. Элементарные алгоритмы машинного обучения 1.3. Кластеризация 1.4. Ансамбли алгоритмов
16,00ч
Модуль 3 Модуль 3. Проектная работа
Темы модуля: 3.1. Разработка и тестирование приложения, основанного на машинном обучении
131,00ч
Модуль 2 Модуль 2. «Нейронные сети и глубокое обучение. Применение в задачах компьютерного зрения и обработки текста»
Темы модуля: 2.1. Нейронные сети 2.2. Машинное обучение в индустрии 2.3. Аналитика данных 2.4 Обработка естественного языка 2.5 Компьютерное зрение
104,00ч
Модуль 1 Модуль 1. «Основы машинного обучения»
Темы модуля: 1.1. Технологии для Data Science 1.2. Элементарные алгоритмы машинного обучения 1.3. Кластеризация 1.4. Ансамбли алгоритмов
131,00ч
Модуль 2 Модуль 2. «Нейронные сети и глубокое обучение. Применение в задачах компьютерного зрения и обработки текста»
Темы модуля: 2.1. Нейронные сети 2.2. Машинное обучение в индустрии 2.3. Аналитика данных 2.4 Обработка естественного языка 2.5 Компьютерное зрение
16,00ч
Модуль 3 Модуль 3. Проектная работа
Темы модуля: 3.1. Разработка и тестирование приложения, основанного на машинном обучении

Преподаватели

Иванов

Владимир Владимирович

Университет Иннополис

доцент, руководитель Лаборатории методов обработки естественного языка в программной инженерии Института разработки ПО и программной инженерии

кандидат физико-математических наук

доцент

96 000 p
Авторизуйтесь чтобы записаться

Профстандарт

Специалист по большим данным

06.042

Ответственный за программу

y.guseva@innopolis.ru

+78432392452