Инженер данных
Московский физико-технический институт (Национальный исследовательский университет)Описание
Программа направлена на повышение квалификации инженеров данных. Невозможно разработать практически полезную систему искусственного интеллекта без качественных данных для обучения. Сбором и подготовкой данных для обучения моделей искусственного интеллекта занимаются инженеры данных. Таким образом, наличие в команде сильного инженера данных во много определяет успех реализации проекта искусственного интеллекта.
Во время обучения вы научитесь: собирать данные для обучения моделей искусственного интеллекта из разных источников: баз данных, интернет, социальных сетей; работать с реляционными базами данных с использованием языка SQL; обучать простые модели машинного обучения; использовать предварительно обученные модели машинного обучения; обрабатывать большие данные; автоматизировать сбор наборов данных и обучение моделей в виде потоков работ MLOps.
Программа подойдет: разработчикам Python начального и среднего уровня, которые хотят освоить новую профессию Инженер данных; специалистам в области машинного обучения начального и среднего уровня, которые хотят научиться готовить данные для обучения моделей.
Для успешного освоения программы необходимы знания начального уровня в следующих областях: Язык программирования Python. Реляционные базы данных. Компьютерные сети, в первую очередь протоколы HTTP и DNS.
Основные модули программы: Жизненный цикл систем искусственного интеллекта. Подготовка данных для систем искусственного интеллекта. Язык SQL и работа с базами данных. Основы машинного обучения и нейронные сети. Инструменты работы с большими данными. Основы автоматизация машинного обучения MLOps.
После окончания программы вы сможете работать на следующих позициях: Инженер данных (Data Engineer); Разработчик машинного обучения/искусственного интеллекта (AI/ML Engineer).
Часов в программе
Цель программы
Актуальность
Входная диагностика 1 час
Итоговая аттестация 50 часов
Компетенции
Профессиональные
ПК-1.р. Способен классифицировать и идентифицировать задачи искусственного интеллекта, выбирать адекватные методы и инструментальные средства решения задач искусственного интеллекта
- Типы задач искусственного интеллекта
- Методы и инструменты систем искусственного интеллекта
ПК-1.1.р. Классифицирует и идентифицирует задачи систем искусственного интеллекта в зависимости от особенностей проблемной и предметной областей
ПК-1.2.р. Выбирает методы и инструментальные средства искусственного интеллекта для решения задач в зависимости от особенностей проблемной области
Компетенция предполагает владение следующими инструментами: Python, sklearn, HuggingFace, TensorFlow
ПК-5.р. Способен использовать инструментальные средства для решения задач машинного обучения
- Классы задач машинного обучения и особенности их применения
- Методы и алгоритмы машинного обучения
ПК-5.1.р. Осуществляет оценку и выбор инструментальных средств для решения поставленной задачи
ПК-5.2.р Разрабатывает модели машинного обучения для решения задач
ПК-5.3.р. Создает, поддерживает и использует системы искусственного интеллекта, включающие разработанные модели и методы, с применением выбранных инструментов машинного обучения
Владение следующими инструментами: Python, sklearn, HuggingFace, TensorFlow, SQL
ПК-6.р. Способен создавать и поддерживать системы искусственного интеллекта на основе нейросетевых моделей и методов
Компетенция предполагает владение следующими знаниями:
- Классы задач машинного обучения и особенности их применения;
- Методы и алгоритмы машинного обучения.
ПК-6.1.р. Осуществляет оценку и выбор моделей искусственных нейронных сетей и инструментальных средств для решения поставленной задачи
ПК-6.2.р. Разрабатывает системы искусственного интеллекта на основе моделей искусственных нейронных сетей и инструментальных средств
Компетенция предполагает владение следующими инструментами: Python, sklearn, HuggingFace, TensorFlow, SQL
ПК-8.р. Способен разрабатывать системы анализа больших данных
- Типы задач искусственного интеллекта
- Методы и инструменты систем искусственного интеллекта
- Классы задач машинного обучения и особенности их применения
ПК-8.1.р. Разрабатывает программные компоненты извлечения, хранения, подготовки больших данных с учетом вариантов использования больших данных, определений, словарей и эталонной архитектуры больших данных
ПК-8.2.р. Разрабатывает программные компоненты обработки, удаленной, распределенной и объединенной аналитики, использования результатов анализа, описания и управления качеством и достоверностью больших данных
Компетенция предполагает владение следующими инструментами: Python, Apache Spark, ClickHouse
ПК-9.р. Способен создавать и внедрять одну или несколько сквозных цифровых субтехнологий искусственного интеллекта
Компетенция предполагает формирование следующих знаний: методы и инструменты обработки больших данных
Уметь:ПК-9.1.р. Участвует в реализации проектов в области сквозной цифровой субтехнологии «Компьютерное зрение»
ПК-9.5.р. Участвует в реализации проектов в области перспективных сквозных цифровых субтехнологий искусственного интеллекта
Владеет следующими инструментами: Python, sklearn, HuggingFace, TensorFlow, SQL, dvc, ClearML
ПК-4.р. Способен разрабатывать и применять методы машинного обучения для решения задач
Классы задач машинного обучения и особенности их применения
Уметь:ПК-4.1.р. Проводит анализ требований и определяет необходимые классы задач машинного обучения
ПК-4.3.р. Принимает участие в оценке и выборе используемых методов машинного обучения
Компетенция предполагает владение следующими инструментами: Python, sklearn, HuggingFace, TensorFlow
A/03.6. Способен осуществлять подготовку данных для проведения аналитических работ по исследованию больших данных
Знания современных методов и инструментальных средств анализа больших данных
Уметь:Умения осуществлять взаимодействие с внутренними и внешними поставщиками данных из гетерогенных источников
Владеть:Владение инструментами определения источников больших данных для анализа, идентификации внешних и внутренних источников данных для проведения аналитических работ; получения и фильтрации больших объемов данных из гетерогенных источников ; извлечения, проверки и очистки больших объемов данных из гетерогенных источников; агрегации и разработки представления больших объемов данных из гетерогенных источников; оценки соответствия набора данных предметной области и задачам аналитических работ.
Общепрофессиональные
ОПК-2. Способен использовать современные информационные технологии и программные средства, в том числе отечественного производства, при решении задач профессиональной деятельности
современных информационных технологий и программных средств, в том числе отечественного производства при решении задач профессиональной деятельности
Уметь:выбирать современные информационные технологии и программные средства, в том числе отечественного производства при решении задач профессиональной деятельности
Владеть:методиками использования программных средств для решения практических задач
Требования
Рекомендуется изучение курса по Python для искусственного интеллекта, например: https://stepik.org/course/110361/promo, или знания в объеме материалов данного курса.
Квалификация
Опыт профессиональной дятельности
Владение необходимыми профессиональными компетенциями
- Работа с реляционными базами данных
- Работа с компьютерными сетями
Иные требования и рекомендации для обучения по программе
Рекомендуется изучение курса по Python для искусственного интеллекта, например: https://stepik.org/course/110361/promo, или знания в объеме материалов данного курса.
Модули
свернутьПреподаватели
Созыкин
Андрей Владимирович
Московский физико-технический институт (Национальный исследовательский университет)
Заместитель директора центра развития ИТ-образования МФТИ
кандидат технических наук
https://www.asozykin.ru/Кошелев
Антон Александрович
Банк Уралсиб
Руководитель группы математического моделирования
кандидат физико-математических наук
Борисов
Василий Ильич
УрФУ
доцент
кандидат технических наук
https://urfu.ru/ru/about/personal-pages/personal/person/v.i.borisov/Долганов
Антон Юрьевич
УрФУ
доцент
кандидат технических наук
https://urfu.ru/ru/about/personal-pages/Personal/person/anton.dolganov/Чернышов
Юрий Юрьевич
Сайберлимфа
исследователь
кандидат физико-математических наук
Якупов
Азат Шавкатович
Лаборатория DataLab Казанского Федерального Университета
Руководитель лаборатории, архитектор данных, преподаватель
https://docs.yandex.ru/docs/view?url=ya-disk-public%3A%2F%2F5tPwniB%2BSGw4SYW0dl4%2FGkYrY4s6YIeNVXsnhX1xYj0jYMGytpMis36zuvjyB66PsLK2WbwBkR%2F%2FqfmVHoPilw%3D%3D%3A%2F%D0%AF%D0%BA%D1%83%D0%BF%D0%BE%D0%B2%20%D0%90.%D0%A8..pdf&name=%D0%AF%D0%BA%D1%83%D0%BF%D0%BE%D0%B2%20%D0%90.%D0%A8..pdf&nosw=1Ронкин
Михаил Владимирович
Уральский федеральный университет
преподаватель
к.т.н.
https://sciencedata.urfu.ru/portal/ru/persons/--(9f605ba0-4452-45e3-90d8-e20bbc574bdb)/activities.htmlЧерноскутов
Михаил Александрович
Уральский федеральный университет
Старший преподаватель
https://sciencedata.urfu.ru/portal/ru/persons/--(b94a0f40-ede8-4f52-9dec-56c7c223e552).htmlПрофстандарт
Специалист по большим данным
06.042Специальность
Инженер данных (Data Engineer)
Отрасль
Промышленность
Ответственный за программу
+79127096478