III уровень

Методы анализа и прогнозирования данных

Томский государственный университет систем управления и радиоэлектроники
260 часов длительность
Онлайн формат
Продвинутый уровень
1 поток (закрыт) 17.06-11.10.2024
2 поток (закрыт) 15.07-15.11.2024

Описание

Курс "Методы анализа и прогнозирования данных" является победителем отбора образовательных программ в 2022 и 2023 годах. В рамках Федерального проекта "Искусственный интеллект" обучение прошли более 250 слушателей.

Программа направлена на выработку компетенций, связанных с проведением анализа данных с применением методов искусственного интеллекта. Изучение осуществляется с применением актуальных практических кейсов, связанных с анализом образов для решения задач биометрической аутентификации при обеспечении доверенного взаимодействия и с обработкой неструктурированной информации на естественном языке. Отдельно рассматриваются вопросы атак на методы искусственного интеллекта и обеспечение доверия к получаемым результатам.

Важная особенность курса - при изучении методов используются наборы данных, связанные с решением задач другой актуальной области - информационной безопасности. В частности, слушатели смогут познакомиться с основными принципами подтверждения личности пользователя по биометрическим характеристикам, например, по особенностям почерка пользователя, и понять какими способами можно повысить защищенность компьютерной системы по сравнению с традиционной парольной защитой.

Программа будет интересна слушателям, заинтересованным в формировании компетенций, связанных с анализом различных данных, а также слушателям, занимающимся обеспечением доверенного взаимодействия с применением биометрической аутентификации и заинтересованным в приложении компетенций по анализу данных к этой предметной области. Изучение курса предполагает выполнение практико-ориентированных кейсов и итоговой усложненной работы на их основе.

По окончании курса Вы будете знать:

  • основные принципы, процесс, стадии и методологии разработки решений на основе ИИ;
  • основные платформы данных (облачные и внутрикорпоративные), применяемые при разработке решений на основе ИИ;
  • основные технологии DS и BigData, используемые для решения практических задач;
  • основные виды представления данных: табличные, графовые, временные ряды;
  • основные определения, историю развития, и главные тренды ИИ;
  • основные инструменты анализа данных и ML (RapidMiner);
  • основные уровни представления данных.

По окончании курса Вы будете уметь:

  • применять инструменты, технологии и библиотеки Data Science при разработке решений на основе ИИ;
  • применять язык программирования Python и библиотеки при разработке решений на основе ИИ;
  • использовать основные статистические методы анализа данных при решении профессиональных задач;
  • реализовывать методы машинного обучения;
  • использовать цифровые платформы анализа данных для решения профессиональных задач.

По окончании курса Вы будете владеть навыками:

  • классификации и идентификации задач систем искусственного интеллекта в зависимости от особенностей проблемной и предметной областей;
  • выбора методов и инструментальных средств искусственного интеллекта для решения задач в зависимости от особенностей проблемной области;
  • сбора исходной информации и формирования требований к решению задач с использованием методов искусственного интеллекта;
  • проведения анализа требований и определения необходимых классов задач машинного обучения;
  • определения метрики оценки результатов моделирования и критериев качества построенных моделей;
  • оценки и выбора используемых методов машинного обучения;
  • проведения оценки и выбора инструментальных средств для решения поставленной задачи;
  • разработки модели машинного обучения для решения задач;
  • поиска данных в открытых источниках, специализированных библиотеках и репозиториях;
  • подготовки и разметки структурированных и неструктурированных данных для машинного обучения;
  • применения знаний о вариантах использования больших данных, определениях, словарях и эталонной архитектуре больших данных для эффективного извлечения, хранения, подготовки больших данных;
  • обработки, удаленной, распределенной и объединенной аналитики, описания и управления качеством и достоверностью, использованием результатов анализа больших данных;
  • решения прикладных задач и участия в реализации проектов в областях сквозных цифровых субтехнологий «Компьютерное зрение», «Обработка естественного языка», «Рекомендательные системы и системы поддержки принятия решений», «Распознавание и синтез речи»;
  • решения прикладных задач и участия в реализации проектов в области перспективных сквозных цифровых субтехнологий искусственного интеллекта.
Часов в программе
48 часов
лекции
96 часов
практика
84 часа
самостоятельная
12 часов
промежуточная аттестация
20 часов
итоговая аттестация
260 часов
всего
Цель программы
Повышение профессионального уровня в области искусственного интеллекта (в частности, при проектировании систем доверенной аутентификации, семантического анализа текста и обеспечения безопасности систем на основе искусственного интеллекта), получение новых и совершенствование имеющихся следующих компетенций, необходимых для профессиональной деятельности:
— способность классифицировать и идентифицировать задачи искусственного интеллекта, выбирать адекватные методы и инструментальные средства решения задач искусственного интеллекта;
— способность разрабатывать и применять методы машинного обучения для решения задач;
— способность использовать инструментальные средства для решения задач машинного обучения;
— способность осуществлять сбор и подготовку данных для систем искусственного интеллекта;
— способность выполнять анализ больших данных;
— способность использовать одну или несколько сквозных цифровых субтехнологий искусственного интеллекта.
Актуальность
Анализ больших объемов данных различного происхождения является актуальным при решении практических задач в любой предметной области. Из встречающихся в повседневной жизни можно выделить такие направления как прогнозирование погоды, управления автомобилями, установление личности пользователей, определение легальных и нелегальных банковских операций и многое другое. В рамках курса слушатели вырабатывают компетенции, позволяющие выделить при решении практической задачи данные, способствующие ее решению, провести предварительную обработку этих данных, выделить наиболее важные из них, выявить противоречия и аномалии и построить модель, позволяющую получить рекомендации по решению поставленной задачи. При решении кейсов используются наборы данных из понятных повседневных жизненных ситуаций, а по применению полученных навыков - они являются актуальными для любых предметных областей и практически невозможно назвать сферу где их нельзя применить.
Входная диагностика
Тест для определения наличия у обучающегося базы, необходимой для эффективного освоения программы.
Итоговая аттестация 20 часов
Итоговой аттестацией по программе является составление аналитического отчета по итогам решения индивидуального практико-ориентированного задания. Для подготовки задания используются наборы данных из открытых репозиториев.

Компетенции

Профессиональные


ПК-1.р. Способен классифицировать и идентифицировать задачи искусственного интеллекта, выбирать адекватные методы и инструментальные средства решения задач искусственного интеллекта
Знать:

- основные виды представления данных: табличные, графовые, временные ряды;
- основные определения, историю развития, и главные тренды ИИ

Уметь:

- применять инструменты, технологии и библиотеки Data Science при разработке решений на основе ИИ;
- использовать цифровые платформы анализа данных для решения профессиональных задач

Владеть:

- навыком классификации и идентификации задач систем искусственного интеллекта в зависимости от особенностей проблемной и предметной областей;
- навыком выбора методов и инструментальных средств искусственного интеллекта для решения задач в зависимости от особенностей проблемной области.
- навыком сбора исходной информации и формирования требований к решению задач с использованием методов искусственного интеллекта.

ПК-4.р. Способен разрабатывать и применять методы машинного обучения для решения задач
Знать:

- основные принципы, процесс, стадии и методологии разработки решений на основе ИИ;
- основные технологии DS и BigData, используемые для решения практических задач

Уметь:

- применять язык программирования Python и библиотеки при разработке решений на основе ИИ;
- реализовывать методы машинного обучения

Владеть:

- навыком проведения анализа требований и определения необходимых классов задач машинного обучения;
- навыком определения метрики оценки результатов моделирования и критериев качества построенных моделей;
- навыком оценки и выбора используемых методов машинного обучения

ПК-5.р. Способен использовать инструментальные средства для решения задач машинного обучения
Знать:

- основные принципы, процесс, стадии и методологии разработки решений на основе ИИ;
- основные инструменты анализа данных и ML (RapidMiner)

Уметь:

- применять инструменты, технологии и библиотеки Data Science при разработке решений на основе ИИ;
- применять язык программирования Python и библиотеки при разработке решений на основе ИИ;
- использовать основные статистические методы анализа данных при решении профессиональных задач

Владеть:

- навыком проведения оценки и выбора инструментальных средств для решения поставленной задачи;
- навыком разработки модели машинного обучения для решения задач

ПК-6.п. Способен осуществлять сбор и подготовку данных для систем искусственного интеллекта
Знать:

- основные платформы данных (облачные и внутрикорпоративные), применяемые при разработке решений на основе ИИ;
- основные виды представления данных: табличные, графовые, временные ряды;
- основные уровни представления данных

Уметь:

- использовать основные статистические методы анализа данных при решении профессиональных задач;
- использовать цифровые платформы анализа данных для решения профессиональных задач

Владеть:

- навыком поиска данных в открытых источниках, специализированных библиотеках и репозиториях;
- навыком подготовки и разметки структурированных и неструктурированных данных для машинного обучения

ПК-7.п. Способен выполнять анализ больших данных
Знать:

- основные принципы, процесс, стадии и методологии разработки решений на основе ИИ;
- основные технологии DS и BigData, используемые для решения практических задач

Уметь:

- применять инструменты, технологии и библиотеки Data Science при разработке решений на основе ИИ;
- реализовывать методы машинного обучения

Владеть:

- навыком применения знаний о вариантах использования больших данных, определениях, словарях и эталонной архитектуре больших данных для эффективного извлечения, хранения, подготовки больших данных;
- навыком обработки, удаленной, распределенной и объединенной аналитики, описания и управления качеством и достоверностью, использованием результатов анализа больших данных

ПК-8.п. Способен использовать одну или несколько сквозных цифровых субтехнологий искусственного интеллекта
Знать:

- основные платформы данных (облачные и внутрикорпоративные), применяемые при разработке решений на основе ИИ;
- основные технологии DS и BigData, используемые для решения практических задач

Уметь:

применять язык программирования Python и библиотеки при разработке решений на основе ИИ

Владеть:

- навыком решения прикладных задач и участия в реализации проектов в области сквозной цифровой субтехнологии «Компьютерное зрение»;
- навыком решения прикладных задач и участия в реализации проектов в области сквозной цифровой субтехнологии «Обработка естественного языка»;
- навыком решения прикладных задач и участия в реализации проектов в области сквозной цифровой субтехнологии «Рекомендательные системы и системы поддержки принятия решений»;
- навыком решения прикладных задач и участия в реализации проектов в области сквозной цифровой субтехнологии «Распознавание и синтез речи»;
- навыком решения прикладных задач и участия в реализации проектов в области перспективных сквозных цифровых субтехнологий искусственного интеллекта

Требования

Нет

Квалификация
Бакалавр, магистр, специалист, специалист среднего звена.
Предварительное освоение иных дисциплин/курсов /модулей
Основы алгоритмизации и программирования
Основы математического анализа
Владение необходимыми профессиональными компетенциями
Базовое знакомство с языками программирования (базовые типы данных, условия, циклы, функции) и с курсом математического анализа (понятия функций, производных, экстремума и методов его поиска).

Модули

свернуть
40ч
Модуль 1 Статистические методы анализа данных. Методы машинного обучения с учителем
Модуль ориентирован на изучение статистических методов анализа данных, включая проведение предварительного анализа данных, осуществление прогнозирования с помощью адаптивных регрессионных моделей, оценку качества моделей. Слушатели познакомятся с основами языка программирования R, а также выполнят кейс на тему "Прогнозирование банкротства компаний"
40ч
Модуль 3 Распознавания образов. Биометрия
Модуль посвящен изучению биометрической аутентификации, методам глубокого обучения с приложением в биометрической аутентификации, возможности аутентификации по голосу, видам атак на методы искусственного интеллекта, а также глубокому обучению на Python. Слушатели выполнять кейсовое задание на тему "Атаки на системы машинного обучения на примере системы аутентификации по голосу"
40ч
Модуль 5 Сегментация и детектирование объектов
Модуль посвящен изучению вопросов обработки изображений, включая подходы к сегментации изображений, к детектированию объектов на изображениях, архитектуру нейронных сетей для сегментации и детектирования объектов, этапы решения задач сегментации и детектирования изображений. Для отработки практических навыков слушателям предстоит выполнить кейсовое задание на тему "Детектирование текста на изображениях и его распознавание (Scene Text Recognition)".
40ч
Модуль 2 Методы машинного обучения без учителя
Модуль посвящен изучению методов машинного обучения без учителя, включая предобработку структурированных данных, методы обучения без учителя, метрики качества кластерного анализа, машинное обучение на базе правил. Слушатели также выполнят кейс на тему "Задачи поиска похожих профилей в социальных сетях для продвижения продукта/услуги"
40ч
Модуль 4 Формирование наборов данных
Модуль посвящен изучению методов съема параметров, способов параметризации подписи, осуществлению анализа данных с помощью Rapid Miner, проведению аутентификации на основе отпечатков пальцев, а также использованию Rapid Miner для аутентификации по динамике подписи. Кроме того, слушателям предстоит выполнить кейсовое задание по теме "Формирование рекуррентным путем набора обучающих данных для аутентификации по отпечаткам пальцев для обеспечения доверенного взаимодействия".
40ч
Модуль 6 Анализ текста и его структуры, обработка естественного языка
Модуль посвящен изучению структуры текста и языковых моделей, рассматриваются способы анализа текста, задачи обработки естественного языка (NLP). Слушатели сформируют представление о способах использования платформ данных и основных направлениях NLP, изучат классификацию текстов методами машинного обучения, узнают методы распределённой обработки данных, рассмотрят основные инструменты для анализа текста, а также для закрепления практических навыков выполнят кейсовое задание "Анализ текста и его структуры с помощью алгоритмов машинного обучения".
40ч
Модуль 1 Статистические методы анализа данных. Методы машинного обучения с учителем
Модуль ориентирован на изучение статистических методов анализа данных, включая проведение предварительного анализа данных, осуществление прогнозирования с помощью адаптивных регрессионных моделей, оценку качества моделей. Слушатели познакомятся с основами языка программирования R, а также выполнят кейс на тему "Прогнозирование банкротства компаний"
40ч
Модуль 2 Методы машинного обучения без учителя
Модуль посвящен изучению методов машинного обучения без учителя, включая предобработку структурированных данных, методы обучения без учителя, метрики качества кластерного анализа, машинное обучение на базе правил. Слушатели также выполнят кейс на тему "Задачи поиска похожих профилей в социальных сетях для продвижения продукта/услуги"
40ч
Модуль 3 Распознавания образов. Биометрия
Модуль посвящен изучению биометрической аутентификации, методам глубокого обучения с приложением в биометрической аутентификации, возможности аутентификации по голосу, видам атак на методы искусственного интеллекта, а также глубокому обучению на Python. Слушатели выполнять кейсовое задание на тему "Атаки на системы машинного обучения на примере системы аутентификации по голосу"
40ч
Модуль 4 Формирование наборов данных
Модуль посвящен изучению методов съема параметров, способов параметризации подписи, осуществлению анализа данных с помощью Rapid Miner, проведению аутентификации на основе отпечатков пальцев, а также использованию Rapid Miner для аутентификации по динамике подписи. Кроме того, слушателям предстоит выполнить кейсовое задание по теме "Формирование рекуррентным путем набора обучающих данных для аутентификации по отпечаткам пальцев для обеспечения доверенного взаимодействия".
40ч
Модуль 5 Сегментация и детектирование объектов
Модуль посвящен изучению вопросов обработки изображений, включая подходы к сегментации изображений, к детектированию объектов на изображениях, архитектуру нейронных сетей для сегментации и детектирования объектов, этапы решения задач сегментации и детектирования изображений. Для отработки практических навыков слушателям предстоит выполнить кейсовое задание на тему "Детектирование текста на изображениях и его распознавание (Scene Text Recognition)".
40ч
Модуль 6 Анализ текста и его структуры, обработка естественного языка
Модуль посвящен изучению структуры текста и языковых моделей, рассматриваются способы анализа текста, задачи обработки естественного языка (NLP). Слушатели сформируют представление о способах использования платформ данных и основных направлениях NLP, изучат классификацию текстов методами машинного обучения, узнают методы распределённой обработки данных, рассмотрят основные инструменты для анализа текста, а также для закрепления практических навыков выполнят кейсовое задание "Анализ текста и его структуры с помощью алгоритмов машинного обучения".

Преподаватели

Катаева

Елена Сергеевна

Томский государственный университет систем управления и радиоэлектроники

старший преподаватель кафедры комплексной информационной безопасности электронно-вычислительных систем

Конев

Антон Александрович

Томский государственный университет систем управления и радиоэлектроники

Заместитель директора Центра компетенций национальной технологической инициативы "Технологии доверенного взаимодействия"

кандидат технических наук

доцент по специальности «Методы и системы защиты информации, информационная безопасность»

Костюченко

Евгений Юрьевич

Томский государственный университет систем управления и радиоэлектроники

Заведующий лабораторией съема, анализа и управления биологическими сигналами

Кандидат технических наук

Доцент по кафедре комплексной информационной безопасности электронно-вычислительных систем

Лунёва

Елена Евгеньевна

Томский государственный университет систем управления и радиоэлектроники

Доцент кафедры комплексной информационной безопасности электронно-вычислительных систем

Кандидат технических наук

Рахманенко

Иван Андреевич

Томский государственный университет систем управления и радиоэлектроники

Доцент кафедры безопасности информационных систем

Кандидат технических наук

Романов

Александр Сергеевич

Томский государственный университет систем управления и радиоэлектроники

Доцент кафедры комплексной информационной безопасности электронно-вычислительных систем

Кандидат технических наук

Якимук

Алексей Юрьевич

Томский государственный университет систем управления и радиоэлектроники

Старший научный сотрудник Института системной интеграции и безопасности

Кандидат технических наук

Банокин

Павел Иванович

Томский государственный университет систем управления и радиоэлектроники

Младший научный сотрудник Научно-инжинирингового центра "Интеллектуальные системы доверенного взаимодействия"

Авторизуйтесь чтобы записаться

Профстандарт

Специалист по большим данным

06.042

Специальность

Аналитик данных (Data Scientist)

Ответственный за программу

do@2i.tusur.ru

+73822701736