III уровень

Технологии инженерии данных в области искусственного интеллекта

Томский государственный университет систем управления и радиоэлектроники
270 часов длительность
Онлайн формат
Базовый уровень
1 поток 17.06-11.10.2024
2 поток 15.07-15.11.2024

Описание

Программа "Технологии инженерии данных в области искусственного интеллекта" направлена на получение слушателями компетенций, необходимых для разработки и применения технологических решений в области искусственного интеллекта, работы с инструментами подготовки и анализа больших данных, решения задач машинного обучения.

Курс открывает двери в захватывающий мир данных, где каждый нюанс превращается в возможность для развития и инноваций. Курс не ограничивается изучением отдельных аспектов инженерии данных, а предлагает комплексный подход к формированию ключевых компетенций, необходимых для успешной работы в этой области: от основных концепций машинного обучения до разработки систем анализа больших данных.  Вы научитесь не просто обрабатывать информацию, но делать это с применением передовых методов и технологий инженерии данных, классифицировать и идентифицировать разнообразные задачи искусственного интеллекта, выбирать наиболее подходящие методы и инструментальные средства для их решения, разрабатывать и применять методы машинного обучения для решения самых разнообразных задач, начиная от простых классификаций и до сложных прогнозов.

У вас сложится полное представление о том, как работать с данными в современном мире!

Вы научитесь создавать и поддерживать системы искусственного интеллекта на основе передовых нейросетевых моделей и методов, а также системы анализа больших данных, которые помогут извлекать ценную информацию из огромных массивов. Вы сможете создать и внедрить одну или несколько сквозных цифровых субтехнологий искусственного интеллекта и на практике применить свои новые навыки.

В основе программы - актуальные практические задания и кейсы, связанные с большими данными и обработкой неструктурированной информации на естественном языке. Реальные кейсы и датасеты предоставлены индустриальными партнёрами ТУСУР - российскими ИТ-компаниями, применяющими технологии интеллектуальной обработки данных для решения своих производственных задач.

Программа предназначена для широкой аудитории слушателей с базовыми навыками в области информационных технологий и программирования на высокоуровневом языке.

По окончании курса Вы будете знать:

  • особенности проблемной и предметной областей, в которых применяются системы искусственного интеллекта;
  • методы и инструментальные средства искусственного интеллекта, их характеристики и возможности;
  • типы задач машинного обучения и их применимость к различным ситуациям;
  • методы машинного обучения и их характеристики;
  • принципы работы и возможности систем искусственного интеллекта;
  • различные типы искусственных нейронных сетей и их характеристики;
  • принципы работы и возможности искусственных нейронных сетей;
  • принципы работы и архитектуры систем обработки больших данных, включая хранение, подготовку и извлечение информации;
  • принципы и методы обработки больших данных, включая удаленную, распределенную и объединенную аналитику;
  • основы перспективных сквозных цифровых субтехнологий искусственного интеллекта и их применение.

 По окончании курса Вы будете уметь:

  • классифицировать задачи систем искусственного интеллекта в соответствии с особенностями проблемной и предметной областей;
  • анализировать особенности проблемной области и выбирать соответствующие методы и инструментальные средства искусственного интеллекта для решения задач;
  • оценивать эффективность методов машинного обучения и выбирать наиболее подходящие для конкретной задачи.
  • оценивать и выбирать инструментальные средства, которые наилучшим образом соответствуют поставленной задаче и требованиям проекта;
  • разрабатывать модели машинного обучения, учитывая специфику задачи и доступные данные;
  • создавать системы искусственного интеллекта, включая разработку и интеграцию моделей и методов машинного обучения;
  • анализировать требования и определять, какие классы задач машинного обучения необходимы для достижения поставленных целей;
  • разрабатывать системы искусственного интеллекта на основе моделей искусственных нейронных сетей и инструментальных средств;
  • разрабатывать программные компоненты для обработки, анализа и управления большими данными, учитывая их варианты использования, определения и словари;
  • разрабатывать программные компоненты.

 По окончании курса Вы будете владеть навыками:

  • идентификации задач систем искусственного интеллекта в различных областях применения;
  • практического применения методов и инструментальных средств искусственного интеллекта для решения задач в различных проблемных областях;
  • проведения анализа требований и определения необходимых классов задач машинного обучения для эффективного решения поставленной задачи.
  • проведения сравнительного анализа методов машинного обучения и принятия обоснованных решений о выборе оптимального метода
  • использования инструментальных средств для решения задач машинного обучения и опытом оценки их эффективности;
  • использования моделей искусственных нейронных сетей и инструментальных средств для решения поставленной задачи;
  • реализации и настройки моделей искусственных нейронных сетей и инструментальных средств для решения поставленной задачи;
  • использования результатов анализа больших данных, описания и управления качеством и достоверностью этих данных.
Часов в программе
76 часов
лекции
100 часов
практика
60 часов
самостоятельная
14 часов
промежуточная аттестация
20 часов
итоговая аттестация
270 часов
всего
Цель программы
Получение или совершенствование компетенций, необходимых для разработки и применения технологических решений в области искусственного интеллекта и в смежных областях по треку инженерии данных:
— способность классифицировать и идентифицировать задачи искусственного интеллекта, выбирать адекватные методы и инструментальные средства решения задач искусственного интеллекта;
— способность разрабатывать и применять методы машинного обучения для решения задач;
— способность использовать инструментальные средства для решения задач машинного обучения;
— способность создавать и поддерживать системы искусственного интеллекта на основе нейросетевых моделей и методов;
— способность разрабатывать системы анализа больших данных;
— способность создавать и внедрять одну или несколько сквозных цифровых субтехнологий искусственного интеллекта.
Актуальность
В мире, где принятие решений играет ключевую роль, умение анализировать данные и делать выводы на их основе становится неоспоримым преимуществом тех специалистов, кто владеет соответствующими компетенциями. С каждым днем объемы данных в мире увеличиваются, и специалисты, способные работать с их большими объемами и извлекать из них ценные знания, становятся ключевыми сотрудниками в любой компании. Организации стремятся к цифровой трансформации, и специалисты по инженерии данных являются двигателями этого процесса, помогая компаниям адаптироваться к новым условиям и максимально эффективно использовать свои ресурсы.
Входная диагностика
Тест для определения наличия у обучающегося базы, необходимой для эффективного освоения программы.
Итоговая аттестация 20 часов
Зачет в форме решения практико-ориентированной задачи (кейса) по одной из практических сфер деятельности

Компетенции

Профессиональные


ПК-1.р. Способен классифицировать и идентифицировать задачи искусственного интеллекта, выбирать адекватные методы и инструментальные средства решения задач искусственного интеллекта
Знать:

З1: особенности проблемной и предметной областей, в которых применяются системы искусственного интеллекта;
З2: методы и инструментальные средства искусственного интеллекта, их характеристики и возможности

Уметь:

У1: классифицировать задачи систем искусственного интеллекта в соответствии с особенностями проблемной и предметной областей;
У2: анализировать особенности проблемной области и выбирать соответствующие методы и инструментальные средства искусственного интеллекта для решения задач

Владеть:

В1: навыками идентификации задач систем искусственного интеллекта в различных областях применения;
В2: навыками практического применения методов и инструментальных средств искусственного интеллекта для решения задач в различных проблемных областях

ПК-4.р. Способен разрабатывать и применять методы машинного обучения для решения задач
Знать:

З3: различные типы задач машинного обучения и их применимость к различным ситуациям;
З4: различные методы машинного обучения и их характеристики

Уметь:

У3: анализировать требования и определять, какие классы задач машинного обучения необходимы для достижения поставленных целей;
У4: оценивать эффективность методов машинного обучения и выбирать наиболее подходящие для конкретной задачи

Владеть:

В3: навыками проведения анализа требований и определения необходимых классов задач машинного обучения для эффективного решения поставленной задачи.
В4: навыками проведения сравнительного анализа методов машинного обучения и принятия обоснованных решений о выборе оптимального метода

ПК-5.р. Способен использовать инструментальные средства для решения задач машинного обучения
Знать:

З5: принципы работы и возможности систем искусственного интеллекта

Уметь:

У5: проводить оценку и выбирать инструментальные средства, которые наилучшим образом соответствуют поставленной задаче и требованиям проекта;
У6: разрабатывать модели машинного обучения, учитывая специфику задачи и доступные данные;
У7: создавать, поддерживать и использовать системы искусственного интеллекта, включая разработку и интеграцию моделей и методов машинного обучения

Владеть:

В5: навыками использования инструментальных средств для решения задач машинного обучения и опытом оценки их эффективности

ПК-6.р. Способен создавать и поддерживать системы искусственного интеллекта на основе нейросетевых моделей и методов
Знать:

З6: различные типы искусственных нейронных сетей и их характеристики;
З7: принципы работы и возможности искусственных нейронных сетей

Уметь:

У8: разрабатывать системы искусственного интеллекта на основе моделей искусственных нейронных сетей и инструментальных средств

Владеть:

В6: навыками использования моделей искусственных нейронных сетей и инструментальных средств для решения поставленной задачи;
В7: навыками реализации и настройки моделей искусственных нейронных сетей и инструментальных средств для решения поставленной задачи

ПК-8.р. Способен разрабатывать системы анализа больших данных
Знать:

З8: принципы работы и архитектуры систем обработки больших данных, включая хранение, подготовку и извлечение информации;
З9: принципы и методы обработки больших данных, включая удаленную, распределенную и объединенную аналитику

Уметь:

У9: разрабатывать программные компоненты для работы с большими данными, учитывая их варианты использования, определения и словари;
У10: разрабатывать программные компоненты для обработки, анализа и управления большими данными

Владеть:

В8: навыками использования результатов анализа больших данных, описания и управления качеством и достоверностью этих данных

ПК-9.р. Способен создавать и внедрять одну или несколько сквозных цифровых субтехнологий искусственного интеллекта
Знать:

З10: основы компьютерного зрения, его принципы и технологии;
З11: основы обработки естественного языка, его принципы и технологии;
З12: основы рекомендательных систем и систем поддержки принятия решений, их принципы и технологии;
З13: основы распознавания и синтеза речи, их принципы и технологии;
З14: основы перспективных сквозных цифровых субтехнологий искусственного интеллекта и их применение

Уметь:

У11: участвовать в проектах по разработке и внедрению систем компьютерного зрения;
У12: участвовать в проектах по разработке и внедрению систем обработки естественного языка;
У13: участвовать в проектах по разработке и внедрению таких систем;
У14: участвовать в проектах по разработке и внедрению систем распознавания и синтеза речи;
У15: участвовать в проектах по разработке и внедрению перспективных сквозных цифровых субтехнологий искусственного интеллекта

Владеть:

В9: навыками работы с программными средствами и технологиями, используемыми в компьютерном зрении;
В10: навыками работы с программными средствами и технологиями, используемыми в обработке естественного языка;
В11: навыками работы с программными средствами и технологиями, используемыми в рекомендательных системах и системах поддержки принятия решений;
В12: навыками работы с программными средствами и технологиями, используемыми в распознавании и синтезе речи;
В13: навыками работы с программными средствами и технологиями, используемыми в перспективных сквозных цифровых субтехнологиях искусственного интеллекта

Требования

Нет

Квалификация
Бакалавр, магистр, специалист
Предварительное освоение иных дисциплин/курсов /модулей
Основы программирования
Владение необходимыми профессиональными компетенциями
Начальные знания в математике и программировании. Приветствуется опыт работы с языком программирования Python

Модули

свернуть
27ч
Модуль 1 Введение в работу с данными в области искусственного интеллекта
Модуль ориентирован на знакомство с профессией инженера данных, изучение базовых понятий языка программирования Python и основ баз данных. Слушатели узнают о способах использования математической статистики для решения задач искусственного интеллекта, поработают с Jupyter и Colab, а также выполнят кейсовое задание на тему "Выгрузка данных из реляционной базы данных с помощью Python-скрипта"
22ч
Модуль 3 Инструменты и методики предварительной обработки и анализа данных
Модуль направлен на изучение инструментов и методик предварительной обработки и анализа данных, включая визуализацию и поиск закономерностей, а также предобработку данных. Слушатели выполнят кейсовое задание по теме «Выявление закономерностей и предварительная обработка данных по мошенничеству с кредитными картами»
50ч
Модуль 5 Основы машинного обучения
Модуль направлен на изучение методов классификации, видов регрессии, основных задач и методов кластеризации. В ходе практических занятий слушатели освоят векторное представление слов и текста, научатся применять деревья и ансамбли, а также выполнят кейсовое задание по теме "Предсказание отклика держателя карты на маркетинговую кампанию банка"
40ч
Модуль 7 Методы глубокого обучения и примеры их практического применения
Модуль направлен на формирование навыков работы с компьютерным зрением и отработку естественного языка. На лекционных занятиях будут рассмотрены рекомендательные системы и способы распознавания речи в s2t, t2s, а также перспективные направления искусственного интеллекта. Слушатели выполнят кейсовое задание по теме "Распознавание лесных пожаров на изображении с помощью YOLOv8"
11ч
Модуль 2 Бизнес-задачи в задачах машинного обучения
Модуль ориентирован на изучение вопросов сбора и верификации требований, рассмотрение A/B тестирования. Слушатели выполнят кейсовое задание по теме "Анализ бизнес-задачи с точки зрения ML-разработчика"
56ч
Модуль 4 Инструменты работы с Big Data
Модуль направлен на изучение основ инженерии данных, оркестрации и создания пайплайна. На лекционных занятиях будут рассмотрены версионирование и способы визуализации в реальном времени. В ходе практических занятий слушатели научатся работать с Hadoop, S3, освоят распределенную обработку и трекинг, а также выполнят кейсовое задание по теме "Оптимизация процесса обработки и анализа текстовых данных"
44ч
Модуль 6 Основы глубокого обучения
Модуль направлен на изучение основ нейронных сетей. В ходе практических занятий слушатели научатся осуществлять предобработку изображений в CNN, рассмотрят особенности рекуррентных нейронных сетей, освоят архитектуру трансформеров, а также выполнят кейсовое задание по теме "Создание многослойного персептрона для предсказания риска диабета пациента"
27ч
Модуль 1 Введение в работу с данными в области искусственного интеллекта
Модуль ориентирован на знакомство с профессией инженера данных, изучение базовых понятий языка программирования Python и основ баз данных. Слушатели узнают о способах использования математической статистики для решения задач искусственного интеллекта, поработают с Jupyter и Colab, а также выполнят кейсовое задание на тему "Выгрузка данных из реляционной базы данных с помощью Python-скрипта"
11ч
Модуль 2 Бизнес-задачи в задачах машинного обучения
Модуль ориентирован на изучение вопросов сбора и верификации требований, рассмотрение A/B тестирования. Слушатели выполнят кейсовое задание по теме "Анализ бизнес-задачи с точки зрения ML-разработчика"
22ч
Модуль 3 Инструменты и методики предварительной обработки и анализа данных
Модуль направлен на изучение инструментов и методик предварительной обработки и анализа данных, включая визуализацию и поиск закономерностей, а также предобработку данных. Слушатели выполнят кейсовое задание по теме «Выявление закономерностей и предварительная обработка данных по мошенничеству с кредитными картами»
56ч
Модуль 4 Инструменты работы с Big Data
Модуль направлен на изучение основ инженерии данных, оркестрации и создания пайплайна. На лекционных занятиях будут рассмотрены версионирование и способы визуализации в реальном времени. В ходе практических занятий слушатели научатся работать с Hadoop, S3, освоят распределенную обработку и трекинг, а также выполнят кейсовое задание по теме "Оптимизация процесса обработки и анализа текстовых данных"
50ч
Модуль 5 Основы машинного обучения
Модуль направлен на изучение методов классификации, видов регрессии, основных задач и методов кластеризации. В ходе практических занятий слушатели освоят векторное представление слов и текста, научатся применять деревья и ансамбли, а также выполнят кейсовое задание по теме "Предсказание отклика держателя карты на маркетинговую кампанию банка"
44ч
Модуль 6 Основы глубокого обучения
Модуль направлен на изучение основ нейронных сетей. В ходе практических занятий слушатели научатся осуществлять предобработку изображений в CNN, рассмотрят особенности рекуррентных нейронных сетей, освоят архитектуру трансформеров, а также выполнят кейсовое задание по теме "Создание многослойного персептрона для предсказания риска диабета пациента"
40ч
Модуль 7 Методы глубокого обучения и примеры их практического применения
Модуль направлен на формирование навыков работы с компьютерным зрением и отработку естественного языка. На лекционных занятиях будут рассмотрены рекомендательные системы и способы распознавания речи в s2t, t2s, а также перспективные направления искусственного интеллекта. Слушатели выполнят кейсовое задание по теме "Распознавание лесных пожаров на изображении с помощью YOLOv8"

Преподаватели

Сидоров

Анатолий Анатольевич

Томский государственный университет систем управления и радиоэлектроники

Заведующий кафедрой автоматизации обработки информации

Кандидат экономических наук

Доцент

Катаев

Михаил Юрьевич

Томский государственный университет систем управления и радиоэлектроники

Профессор кафедры автоматизированных систем управления, главный научный сотрудник Лаборатории объектно-ориентированного моделирования информационных систем

Доктор технических наук

Профессор

Гриценко

Юрий Борисович

Томский государственный университет систем управления и радиоэлектроники

Доцент кафедры автоматизации обработки информации, начальник инновационного управления ТУСУР

Кандидат технических наук

Доцент

Сенченко

Павел Васильевич

Томский государственный университет систем управления и радиоэлектроники

Доцент кафедры автоматизации обработки информации, ведущий научный сотрудник Лаборатории объектно-ориентированного моделирования информационных систем

Кандидат технических наук

Доцент

Кульшин

Роман Сергеевич

Томский государственный университет систем управления и радиоэлектроники

Ассистент кафедры автоматизации обработки информации, генеральный директор ООО “ЭТИКОН”

Тикшаев

Иван Денисович

Томский государственный университет систем управления и радиоэлектроники

Ассистент кафедры автоматизации обработки информации, генеральный директор ООО “ДЕВИНСАЙД”

Волокитин

Геннадий

Томский государственный университет систем управления и радиоэлектроники

Ассистент кафедры автоматизации обработки информации

Авторизуйтесь чтобы записаться

Профстандарт

Специалист по большим данным

06.042

Специальность

Инженер данных (Data Engineer)

Ответственный за программу

do@2i.tusur.ru

+73822701736