III уровень Большие данные

Инженер данных (Data engineer)

МГТУ им. Н.Э. Баумана
252 часа длительность
Онлайн формат
Базовый уровень
1 поток (закрыт) 10.06-03.12.2023
2 поток (закрыт) 10.06-04.12.2023
3 поток (закрыт) 10.06-05.12.2023

Описание

Инженер данных (Data Engineer) – это специалист по обработке данных, который отвечает за создание и поддержку архитектуры данных в Data Science-проекте. В сферу его компетенций входит обеспечение бесперебойного потока данных между сервером и приложением, интеграцию ПО для управления данными, оптимизацию ключевых процессов данных, а также владение множеством современных технологий и инструментов для эффективной работы с хранилищами данных, искусственным интеллектом, машинным обучением и др.

Программа повышения квалификации «Инженер данных (Data Engineer)» разработана ведущими преподавателями-практиками МГТУ им. Н.Э. Баумана и включает практические кейсы, основанные на реальных бизнес-задачах. Слушатели, успешно освоившие программу курса, смогут применять полученные знания для решения прикладных задач анализа данных (включая Big Data), знать и применять инструменты на основе технологий искусственного интеллекта с фокусом на организацию работ по получению, структурированию, обработке, предобработке и использованию данных различного объема.

После прохождения итоговой аттестации выпускники программы «Инженер данных (Data Engineer)» получат удостоверение о повышении квалификации образца МГТУ им. Н.Э. Баумана.

Часов в программе
33 часа
лекции
102 часа
практика
98 часов
самостоятельная
8 часов
промежуточная аттестация
1 час
входная диагностика
10 часов
итоговая аттестация
252 часа
всего
Цель программы
Цель программы - получить компетенции, необходимые для профессиональной деятельности специалиста в области сбора, обработки, интеллектуального анализа больших данных и использования результатов такой обработки при реализации проектов и разработки новых решений на основе данных. Данная программа знакомит слушателя с основными разделами науки о данных.
Актуальность
Data Science сегодня — это одно из самых востребованных направлений подготовки в бизнес-аналитике. В основе Data Science лежит работа с большими данными (Big Data).
Быстрый прирост информации в мире происходит в геометрической прогрессии. Правильное использование больших данных позволяет получить полезную информацию в любой области. Наука о данных пользуется большим спросом и объясняет, как цифровые данные преобразуют бизнес и помогают ему принимать более четкие и важные решения.
Основное отличие Data Science от классических методов бизнес-аналитики — это поиск связей и закономерностей в массивах информации, для разработки моделей, предсказывающей результат.
Входная диагностика 1 час
Для зачисления на курс необходимо пройти предварительное тестирование для определения стартового уровня знаний.
Итоговая аттестация 10 часов
Итоговая аттестация проводится в форме зачета по результатам тестирования и решения практического кейса, полученных в ходе обучения знаний.

Компетенции

Профессиональные


ПК-1.р. Способен классифицировать и идентифицировать задачи искусственного интеллекта, выбирать адекватные методы и инструментальные средства решения задач искусственного интеллекта.
Знать:

Знает методы и инструментальные средства искусственного интеллекта для решения задач в зависимости от особенностей проблемной области.

Уметь:

Умеет классифицировать и идентифицирует задачи систем искусственного интеллекта в зависимости от особенностей проблемной и предметной областей.

Владеть:

Выбирает методы и инструментальные средства искусственного интеллекта для решения задач в зависимости от особенностей проблемной области.

ПК-4.р. Способен разрабатывать и применять методы машинного обучения для решения задач.
Уметь:

Умеет проводить анализ требований и определяет необходимые классы задач машинного обучения.

Владеть:

Принимает участие в оценке и выборе используемых методов машинного обучения.

ПК-5.р. Способен использовать инструментальные средства для решения задач машинного обучения.
Знать:

Знает способы использования инструментальных средства для решения задач машинного обучения.

Уметь:

Умеет осуществлять оценку и выбор инструментальных средств для решения поставленной задачи.

Владеть:

Разрабатывает модели машинного обучения для решения задач.

Создает, поддерживает и использует системы искусственного интеллекта, включающие разработанные модели и методы, с применением выбранных инструментов машинного обучения

ПК-6.р. Способен создавать и поддерживать системы искусственного интеллекта на основе нейросетевых моделей и методов.
Знать:

Знает виды моделей искусственных нейронных сетей и инструментальные средства.

Уметь:

Умеет осуществлять оценку и выбор моделей искусственных нейронных сетей и инструментальных средств для решения поставленной задачи.

Владеть:

Разрабатывает системы искусственного интеллекта на основе моделей искусственных нейронных сетей и инструментальных средств.

ПК-8.р. Способен разрабатывать системы анализа больших данных
Знать:

Знает средства разработки программных компонентов, средства извлечения, хранения, подготовки больших данных с учетом вариантов использования больших данных, определений, словарей и эталонной архитектуры больших данных.

Знает средства разработки программных компонентов, средства обработки, удаленной, распределенной и объединенной аналитики, использования результатов анализа, описания и управления качеством и достоверностью больших данных.

Уметь:

Умеет разрабатывать программные компоненты извлечения, хранения, подготовки больших данных с учетом вариантов использования больших данных, определений, словарей и эталонной архитектуры больших данных

Умеет разрабатывать программные компоненты обработки, удаленной, распределенной и объединенной аналитики, использования результатов анализа, описания и управления качеством и достоверностью больших данных

Владеть:

Разрабатывает программные компоненты извлечения, хранения, подготовки больших данных с учетом вариантов использования больших данных, определений, словарей и эталонной архитектуры больших данных

Разрабатывает программные компоненты обработки, удаленной, распределенной и объединенной аналитики, использования результатов анализа, описания и управления качеством и достоверностью больших данных

ПК-9.р. Способен создавать и внедрять одну или несколько сквозных цифровых субтехнологий искусственного интеллекта.
Владеть:

Участвует в реализации проектов в области сквозной цифровой субтехнологии «Компьютерное зрение»
Участвует в реализации проектов в области сквозной цифровой субтехнологии «Обработка естественного языка»
Участвует в реализации проектов в области сквозной цифровой субтехнологии «Рекомендательные системы и системы поддержки принятия решений»
Участвует в реализации проектов в области сквозной цифровой субтехнологии «Распознавание и синтез речи»
Участвует в реализации проектов в области перспективных сквозных цифровых субтехнологий искусственного интеллекта

Требования

Нет

Образование
  • Высшее образование
  • Среднее профессиональное образование
Владение необходимыми профессиональными компетенциями
1. Способен участвовать в разработке технической документации программных продуктов и комплексов с использованием стандартов, норм и правил, а также в управлении проектами создания информационных систем на стадиях жизненного цикла.
Профессиональные:
Знать: Типовые решения, библиотеки программных модулей, шаблоны, классы объектов, используемые при разработке программного обеспечения
Уметь: Использовать существующие типовые решения и шаблоны проектирования программного обеспечения.
Владеть: Проектированием структур данных
2. Способен инсталлировать и сопровождать программное обеспечение информационных систем и баз данных, в том числе отечественного происхождения, с учетом информационной безопасности
Профессиональные:
Знать: Методы и средства проектирования баз данных.
Уметь: Применять методы и средства проектирования программного обеспечения, структур данных, баз данных, программных интерфейсов.
Владеть: Проектированием баз данных.
3. Написание программного кода с использованием языков программирования, определения и манипулирования данными
профессиональные
Знать: Синтаксис выбранного языка программирования, особенности программирования на этом языке, стандартные библиотеки языка программирования. Технологии программирования. Особенности выбранной среды программирования и системы управления базами данных
Уметь: Применять выбранные языки программирования для написания программного кода. Использовать выбранную среду программирования и средства системы управления базами данных.
Владеть: Методами оптимизации программного кода с использованием специализированных программных средств. Методами оценки и согласования сроков выполнения поставленных задач.

Модули

свернуть
167ч
Модуль 1 Базовый модуль
В ходе изучения модуля обучающиеся получат знания, навыки и умения в области сбора, обработки, интеллектуального анализа больших данных и использования результатов такой обработки, а также ознакомятся с технологиями баз данных, техниками проектирования структур и баз данных, методами и инструментами сбора, подготовки, обработки и управления данными, методами обработки данных в промышленной аналитике и задачах бизнес-аналитики; дать умения и практические навыки по формированию нейросетевых и других видов регрессоров, классификаторов и прогнозных моделей.
74ч
Модуль 2 Профессиональный модуль
В ходе изучения модуля обучающиеся получат знания, навыки и умения в области препроцессинга данных, проектирования и разработки программного обеспечения для решения базовых типов практических задач машинного обучения и анализа больших данных, а также ознакомятся с технологиями подготовки данных и технологиями разработки компьютерных программ на языке Python для решения следующих типовых задач машинного обучения: задачи компьютерного зрения, задачи обработки естественного языка на основе технологий искусственного интеллекта
167ч
Модуль 1 Базовый модуль
В ходе изучения модуля обучающиеся получат знания, навыки и умения в области сбора, обработки, интеллектуального анализа больших данных и использования результатов такой обработки, а также ознакомятся с технологиями баз данных, техниками проектирования структур и баз данных, методами и инструментами сбора, подготовки, обработки и управления данными, методами обработки данных в промышленной аналитике и задачах бизнес-аналитики; дать умения и практические навыки по формированию нейросетевых и других видов регрессоров, классификаторов и прогнозных моделей.
74ч
Модуль 2 Профессиональный модуль
В ходе изучения модуля обучающиеся получат знания, навыки и умения в области препроцессинга данных, проектирования и разработки программного обеспечения для решения базовых типов практических задач машинного обучения и анализа больших данных, а также ознакомятся с технологиями подготовки данных и технологиями разработки компьютерных программ на языке Python для решения следующих типовых задач машинного обучения: задачи компьютерного зрения, задачи обработки естественного языка на основе технологий искусственного интеллекта

Преподаватели

Антонова

Вероника Михайловна

МГТУ им. Н.Э. Баумана, к.т.н.

доцент МГТУ им. Н.Э. Баумана

Соколов

Григорий Владимирович

МГТУ им. Н.Э. Баумана

Senior data scientist, старший преподаватель МГТУ им. Н.Э. Баумана

Пересунько

Евгения Олеговна

МГТУ им. Н.Э. Баумана

Ассистент

Пересунько

Павел Викторович

МГТУ им. Н.Э. Баумана

Старший преподаватель

Панфилов

Илья Александрович

МГТУ им. Н.Э. Баумана

доцент МГТУ им. Н.Э. Баумана

Тынченко

Вадим Сергеевич

МГТУ им. Н.Э. Баумана

Руководитель департамента технологий искусственного интеллекта, к.т.н.

Доцент

Бухтояров

Владимир Викторович

МГТУ им. Н.Э. Баумана, к.т.н.

доцент МГТУ им. Н.Э. Баумана

Доррер

Михаил Георгиевич

МГТУ им. Н.Э. Баумана

Старший преподаватель

Кандидат технических наук

Масич

Игорь Сергеевич

МГТУ им. Н.Э. Баумана

Ведущий научный сотрудник

Доктор технических наук

доцент

Курашкин

Сергей Олегович

МГТУ им. Н.Э. Баумана

Исследователь. Преподаватель-исследователь

Авторизуйтесь чтобы записаться

Профстандарт

Специалист по большим данным

06.042

Ответственный за программу

do@edubmstu.ru

+7(495)1828385