III уровень

Технический аналитик (AI/TADS Analytic (Предиктивная аналитика в промышленности и медицине)

Уфимский университет науки и технологий
288 часов длительность
Онлайн формат
1 поток (закрыт) 24.06-02.11.2024

Описание

Дополнительная профессиональная программа «Технический аналитик (AI/TADS Analytic (Предиктивная аналитика в промышленности и медицине)» (288 ч) направлена на подготовку специалистов в области анализа и переподготовки данных для использования их при решении задач средствами искусственного интеллекта. Программа ориентирована в первую очередь на решение задач в области предиктивного анализа, поэтому рассматриваются соответствующие алгоритмы машинного обучения, позволяющие получить как прогнозы на перспективу, так и казуальные (причинно-следственные) прогнозы. Особенностью программы, является изучение перспективных методов искусственного интеллекта, заключающиеся в комбинации искусственных нейронных сетей с классическими моделями предиктивной статистики (DeepSurv, DeepAR).

Основной целью программы является сформировать навыки применения методов предобработки, хранения и использования больших данных в целях построения прогнозных моделей средствами искусственного интеллекта. В качестве инструментов рассматриваются как классические инструменты машинного обучения (логистическая регрессия, деревья решения), так и ансамблиевые алгоритмы и алгоритмы анализа временных рядов и анализа выживаемости (надежности), применяемые в области предиктивного анализа, а также искусственные нейронные сети для прогнозирования динамики.  Особенностью программы является наличие внутри нее двух образовательных треков, ориентированных на применение изучаемых алгоритмов машинного обучения к решению задач в медицине или в промышленности. То есть слушатель может выбрать с каким набором данных ему выполнять задание – медицинским или промышленным: например, для решения задачи прогноза «приживётся» зубной имплантат или нет и решения задачи прогноза отказа насосного оборудования применяется один и тот же инструмент машинного обучения, но при этом будут использованы свои наборы данных.

Преимуществом программы является ее нацеленность на получение практических навыков работы с данными (в том числе с данными типа временных рядов и цензурированными данными, возникающими при решении задач прогноза отказа оборудования и выживаемости больных), проведение комплексного эксплоративного анализа, организации хранения информации и применения алгоритмов машинного обучения. В качестве выпускной квалификационной работы слушателям необходимо будет выполнить практикоориентированный проект.

Слушатели, прошедшие обучение в рамках данной программы, смогут претендовать на позиции начинающих разработчиков, аналитиков, технических аналитиков, специалистов по машинному обучению и инженеров в промышленных компаниях и медицинских учреждениях, научных институтах. Потребность в таких специалистах в настоящее время огромна.

Часов в программе
34 часа
лекции
60 часов
практика
171 час
самостоятельная
5 часов
промежуточная аттестация
18 часов
итоговая аттестация
288 часов
всего
Цель программы
Целью образовательной программы является получение новых компетенций, необходимых для профессиональной деятельности в области подготовки, разработки и сопровождению проектов по искусственному интеллекту
Актуальность
Настоящее время представляет собой эпоху данных и активной цифровизации, в связи с чем умение работать с данными становится все более актуальной. Создание информационных технологий нового поколения, которые обеспечивают экономически эффективное извлечение полезной информации из больших объемов данных, все чаще определяет рост предприятия и его конкуретоспособность. Анализ данных нужен для управления и принятия решений, а также для разработки на их основе новых продуктов и услуг. Это делает актуальным подготовку специалистов, участвующих в процессе изучения данных, относящихся к конкретной ситуации, и вырабатывающих рекомендации, которые, дадут желаемые результаты. Принимая во внимание то, что объем данных неуклонно растет преимущественно в части увеличения объемов неструктурированной информации, особую актуальность для технического аналитика имеет тщательная и корректная обработка данных, особенно в области решений предиктивной аналитики, так как данные временных рядов являются реализацией случайных процессов и требует особого внимания при подготовке к использованию.
Итоговая аттестация 18 часов
Выполнение практико-ориентированного кейса

Компетенции

Профессиональные


ПК-1.р. Способен классифицировать и идентифицировать задачи искусственного интеллекта, выбирать адекватные методы и инструментальные средства решения задач искусственного интеллекта
Знать:

- знает методы сбора исходной информации
- знает основные требования, предъявляемые к решению задач с использованием методов искусственного интеллекта

Уметь:

- умеет определять требования к решению задач опираясь на свойства исходной информации

Владеть:

- собирает исходную информацию, в том числе из открытых источников в сети интернет, формирует требования к решению задач с использованием методов искусственного интеллекта

ПК-4.р. Способен разрабатывать и применять методы машинного обучения для решения задач
Знать:

- принципы работы алгоритмов машинного обучения (с учителем, без учителя, полуконтролируемые алгоритмы);
- основные требования и классы моделей машинного обучения в зависимости от типа входной информации (регрессии, классификации, модели анализа выживаемости);
- метрики качества для различных алгоритмов машинного обучения в зависимости от класса решаемых задач;
- методы семплирования для получения сбалансированных выборок

Уметь:

- анализировать поставленную задачу и определять подходящий класс задач машинного обучения для ее решения, в том числе в зависимости от типа данных целевой переменной и признаков влияния;
-рассчитывать метрики качества моделей в зависимости от класса задач машинного обучения и анализировать их результаты для выбора оптимальной модели.

Владеть:

- проведение анализа требований поставленных задач и определения классов алгоритмов машинного обучения, позволяющих их решить
- определения метрик качества, интерпретация и визуализация полученных результатов моделирования, формирование выводов.

ПК-5.р. Способен использовать инструментальные средства для решения задач машинного обучения
Знать:

- алгоритмы машинного обучения – бинарные модели регрессии, модели регрессии (метод LASSO и гребневой регрессии); процедуры бустинга, методы деревьев решений и случайного леса);.
- алгоритмы машинного обучения по цензурированным данным в качестве признаков влияния, модели анализа выживаемости, в том числе в байесовских оценках;
- модели прогнозирования, на основе анализа временных рядов;
- различные инструментальные средства и библиотеки, используемые в сфере анализа данных и машинного обучения;

Уметь:

умеет строить адекватные алгоритмы машинного обучения бинарные модели регрессии, модели регрессии (метод LASSO и гребневой регрессии); процедуры бустинга, методы деревьев решений и случайного леса) ()
- умеет подбирать оптимальные гиперпараметры и параметры алгоритмов, проверять их корректность; и – умеет строить прогнозные модели на основе анализа временных рядов.
-умеет выбирать наиболее подходящие инструментальные средства для решения задач машинного обучения.

Владеть:

- получает качественные алгоритмы машинного обучения для применения их в задачах предиктивной аналитики;
- работает с выбранными инструментальными средствами и библиотеками, необходимыми для выполнения конкретной задачи средствами машинного обучения.

ПК-6.р. Способен создавать и поддерживать системы искусственного интеллекта на основе нейросетевых моделей и методов
Знать:

- знает принципы работы и обучения рекуррентных искусственных нейронных сетей, сетей с архитектурой LSTM, GRU.

Уметь:

- умеет подбирать необходимую архитектуру искусственной нейронной сети и обучать ее в целях прогнозирования динамики показателей.

Владеть:

Осуществляет оценку и выбор моделей искусственных нейронных сетей и инструментальных средств для решения поставленной задачи в области предиктивной аналитики

ПК-7.п. Способен выполнять анализ больших данных
Знать:

- знает концептуальные основы хранения данных в структурированном виде, теорию реляционных баз данных;
- знает технологии распределенных вычислений (кластеров), системы планирования заданий, методы решения задач обработки и анализа больших данных.

Уметь:

- умеет проводить анализ предметной области, выявлять информационные потребности и разрабатывать требования для построения базы данных;
- умеет создавать сложные запросы и скрипты для реализации многооператорных запросов и обработки реляционных баз данных;
- умеет разрабатывать и анализировать модели прикладных задач анализа больших данных.

Владеть:

- применяет навыки работы в программных системах, предназначенных для создания и управления базами данных, извлечения данных из баз данных;
- применяет навыки работы в программных системах, предназначенных для анализа больших данных.

ПК-7.р. Способен осуществлять сбор и подготовку данных для систем искусственного интеллекта
Знать:

- знает особенности, виды, источники структурированных и неструктурированных данных;
- знает, структуры данных, метаданных, различает кросс-секционные данные, временные ряды, панельные и пространственно-ориентированные данные: различия и особенности их обработки;
-знает основные виды эксплоративного анализа данных;
-знает основные типы случайных процессов, к которым относятся данные в виде временных рядов;

Уметь:

- умеет проводить первичную предобработку структурированных и неструктурированных данных (восполнение, удаление аномалий, бининг, стандартизация и нормализация, разделение, фильтрация и селекция), объединять несколько наборов данных по ключу;
- умеет осуществлять сбор, подготовку и разметку данных из открытых источников в сети интернет
-умеет проводить эксплоративный анализ данных (в том числе автоматический) в целях нахождения зависимостей между данными;
-умеет проводить предварительную обработку данных типа временных рядов и определять типы случайного процесса, лежащих в их основании

Владеть:

- настройка автоматизированного сбора данных из открытых источников в сети интернет и их подготовка для последующей обработки
- предобработка «сырой» информации для возможности ее дальнейшего использования при разработке систем искусственного интеллекта;
-проведение эксплоративного анализа данных в целях дальнейшей разработки систем искусственного интеллекта;
-исследование временных рядов в целях дальнейшего построения моделей прогнозной аналитики средствами искусственного интеллекта.

ПК-8.и. Способен использовать одну или несколько сквозных цифровых субтехнологий искусственного интеллекта
Знать:

-знает основные принципы использования классов задач в области искусственного интеллекта для разработки «Рекомендательных систем и систем поддержки принятия решений»

Уметь:

Умеет определять какие из классов задач в области искусственного интеллекта могут быть использованы для разработки «Рекомендательных систем и систем поддержки принятия решений»

Владеть:

Решает прикладные задачи и участвует в реализации проектов в области сквозной цифровой субтехнологии «Рекомендательные системы и системы поддержки принятия решений»

ПК-9.р. Способен создавать и внедрять одну или несколько сквозных цифровых субтехнологий искусственного интеллекта
Знать:

-знает основные принципы разработки проектов ы области искусственного интеллекта для разработки «Рекомендательных систем и систем поддержки принятия решений»

Уметь:

Умеет определять необходимость использования инструментов искусственного интеллекта для «Рекомендательных систем и систем поддержки принятия решений»

Владеть:

Участвует в реализации проектов в области сквозной цифровой субтехнологии «Рекомендательные системы и системы поддержки принятия решений»

Требования

Требования к оборудованию и ПО слушателей:

  • наличие персонального компьютера или ноутбука (операционная система Windows);
  • наличие доступа в сеть Интернет;
  • наличие гарнитуры, микрофона для видеоконференцсвязи с преподавателями;
  • установленное ПО (возможна установка в процессе обучения): R, RStudio, MS SQL Server и др.
Квалификация
Наличие законченного высшего образования или средне-специального образования
Предварительное освоение иных дисциплин/курсов /модулей
Знание основ линейной алгебры, теории вероятностей, математической статистики и информатики/программирования
Иные требования и рекомендации для обучения по программе

Требования к оборудованию и ПО слушателей:

  • наличие персонального компьютера или ноутбука (операционная система Windows);
  • наличие доступа в сеть Интернет;
  • наличие гарнитуры, микрофона для видеоконференцсвязи с преподавателями;
  • установленное ПО (возможна установка в процессе обучения): R, RStudio, MS SQL Server и др.

Модули

свернуть
54ч
Модуль 1 Предварительная обработка и автоматический эксплораторный анализ различных типов данных
Тема 1.1 Виды, тип и формат данных. Стандарты по работе с данными Тема 1.2 Предобработка данных Тема 1.3 Эксплоративный анализ данных Тема 1.4 Предварительный анализ временных рядов
36ч
Модуль 3 Технологии хранения данных
Тема 3.1 Введение в базы данных Тема 3.2 Создание и обращение к базе данных в СУБД MS SQL Server. Тема 3.3 Технологии работы с большими данными
54ч
Модуль 5 Алгоритмы прогнозной аналитики
Тема 5.1 Модели на основе анализа временных рядов Тема 5.2 Искусственные нейронные сети для прогнозирования динамики Тема 5.3 Перспективные методы искусственного интеллекта
54ч
Модуль 2 Парсинг и web-скрейпинг
Тема 2.1. Основы сбора данных в сети интернет Тема 2.2. Web-скрейпинг динамических сайтов Тема 2.3. Сбор данных средствами API
72ч
Модуль 4 Алгоритмы машинного обучения
Тема 4.1 Регрессия Тема 4.2 Деревья решений Тема 4.3 Технологии сэмплирования Тема 4.4 Модели выживаемости/надежности
54ч
Модуль 1 Предварительная обработка и автоматический эксплораторный анализ различных типов данных
Тема 1.1 Виды, тип и формат данных. Стандарты по работе с данными Тема 1.2 Предобработка данных Тема 1.3 Эксплоративный анализ данных Тема 1.4 Предварительный анализ временных рядов
54ч
Модуль 2 Парсинг и web-скрейпинг
Тема 2.1. Основы сбора данных в сети интернет Тема 2.2. Web-скрейпинг динамических сайтов Тема 2.3. Сбор данных средствами API
36ч
Модуль 3 Технологии хранения данных
Тема 3.1 Введение в базы данных Тема 3.2 Создание и обращение к базе данных в СУБД MS SQL Server. Тема 3.3 Технологии работы с большими данными
72ч
Модуль 4 Алгоритмы машинного обучения
Тема 4.1 Регрессия Тема 4.2 Деревья решений Тема 4.3 Технологии сэмплирования Тема 4.4 Модели выживаемости/надежности
54ч
Модуль 5 Алгоритмы прогнозной аналитики
Тема 5.1 Модели на основе анализа временных рядов Тема 5.2 Искусственные нейронные сети для прогнозирования динамики Тема 5.3 Перспективные методы искусственного интеллекта

Преподаватели

Лакман

Ирина Александровна

ФГБОУ ВО УУНиТ

Заведующая научной лабораторией, руководитель направления искусственный интеллект, ИТ-компания ООО «Лексема»

Кандидат технических наук

Доцент

https://uust.ru/bmi/prepod-sostav/

Исламов

Ильшат Яхиевич

Уфимский университет науки и технологий

Доцент кафедры цифровой экономики и коммуникаций

Кандидат экономических наук

Доцент

https://inefb.ru/58-%20ob-%20institute/kafedry/ka%20fedra-%20matematicheskie-%20metody-v-%20ekonomike/sotrudn%20iki-kafedry-%20matematicheskie-%20metody-v-%20ekonomike/239-%20islamov-ilshat-%20yakhievich

Прудников

Вадим Борисович

ФГБОУ ВО УУНиТ

Доцент кафедры цифровой экономики и коммуникаций

Кандидат технических наук

Доцент

Абзалилова

Лия Рашитовна

ФГБОУ ВО УУНиТ

Доцент кафедры цифровой экономики и коммуникаций

Кандидат физико-математических наук

Тимирьянова

Венера Маратовна

ФГБОУ ВО УУНиТ

главный научный сотрудник лаборатории исследования социально-экономических проблем регионов

Доктор экономических наук

Доцент

Авторизуйтесь чтобы записаться

Профстандарт

Специалист по большим данным

06.042

Специальность

Технический аналитик (AI/TADS Analytic)

Отрасль

Промышленность

Ответственный за программу

dpo_ino_2024@mail.ru

+78002003568