III уровень

Аналитик данных

Уфимский университет науки и технологий
252 часа длительность
Онлайн формат
1 поток 24.06-02.11.2024

Описание

Дополнительная профессиональная программа «Аналитик данных» направлена на подготовку на специалистов организаций, преподавателей вузов, научных сотрудников, магистров, аспирантов и иных слушателей, заинтересованных в изучении технологий искусственного интеллекта и машинного обучения. 

Программа разработана в соответствии с профессиональным стандартом 06.046 «Специалист по моделированию, сбору и анализу данных цифрового следа», утвержденного приказом Министерства труда и социальной защиты РФ от 09 июля 2021 г. № 462н.

Программа позволит сформировать у слушателей целостное представления о проблемах, возникающих в области работы с данными и их решении с учетом различных условий, выявлять и решать проблемы сбора, анализа, обработки и представления разнородных данных в цифровой форме.

Обучение проходит в очно-заочном формате с применением дистанционных технологий. Программа включает следующие основные модули: данные и современные технологические решения, разработка программных решений для анализа данных с использованием R и Python, основные модели и методы анализа данных на основе искусственного интеллекта, основные технологии искусственного интеллекта и машинного обучения, технологии анализа больших данных, прикладной искусственный интеллект. Прохождение курса позволит слушателям получить теоретические знания в области анализа данных с применением искусственного интеллекта и машинного обучения, навыки владения программными средствами для анализа и визуализации данных, навыки решения практических задач в различных областях. 

Деятельность специалистов, завершивших обучение по данной программе, может быть направлена как на проектную деятельность в сфере сбора, подготовки и анализа данных, так и на разработку методологического обеспечения комплексного анализа деятельности человека (группы людей) и ИКС.

Часов в программе
46 часов
лекции
92 часа
практика
102 часа
самостоятельная
10 часов
промежуточная аттестация
2 часа
итоговая аттестация
252 часа
всего
Цель программы
Целью реализации является формирование у слушателей целостного представления о проблемах, возникающих в области работы с данными (распределенность, разнородность, большие объемы, динамика изменений, актуальность, достоверность и пр.) и их решении с учетом различных условий, что позволит выявлять и решать проблемы сбора, анализа, обработки и представления разнородных данных (структурированных, слабоструктурированных и неструктурированных данных) в цифровой форме. Формирование у слушателей профессиональных компетенций, необходимых для выполнения нового вида профессиональной деятельности, позволит приобрести новую квалификацию Аналитик данных.
Актуальность
Актуальность программы обусловлена увеличением объемов цифрового следа, развитием теоретического аппарата искусственного интеллекта и машинного обучения, инструментария, реализующего этот аппарат, которые позволяют проводить обработку и анализ данных с целью получения результатов, полезных для принятия управленческих решений. Развитие технологических решений позволяет расширять диапазон решаемых задач в науке, индустрии, медицине, сфере оказания услуг и др. Рассматриваемый теоретический аппарат и инструментальные средства курса направлены на решения, которые тесно переплетаются с технологическими задачами дорожной карты по искусственному интеллекту.
Итоговая аттестация 2 часа
Защита практико-ориентированного кейса

Компетенции

Профессиональные


ПК-5.р. Способен использовать инструментальные средства для решения задач машинного обучения
Знать:

Специализированное программное обеспечение для анализа данных
Языки программирования
Методы математической статистики
Принципы работы и особенности применения нейронных

Уметь:

Применять специализированное программное обеспечение для анализа данных
Проводить сравнительный анализ для проверки гипотез, представленных в модели деятельности человека (группы людей) и ИКС

Владеть:

Автоматизация выявления закономерностей в массивах данных
Разработка алгоритмов решения поставленных задач

ПК-.6.п. Способен осуществлять сбор и подготовку данных для систем искусственного интеллекта
Знать:

Требования законодательства Российской Федерации о защите персональных данных
Методы и средства защиты информации
Требования законодательства Российской Федерации о защите интеллектуальной собственности
Методы оценки качества данных в области информационных технологий
Методы математической статистики
Методы корреляционного и ковариационного анализа
Принципы работы и особенности применения нейронных сетей для анализа данных
Методы факторного и кластерного анализа
Методы семантического анализа

Уметь:

Определять корректный и репрезентативный источник данных
Преобразовывать и подготавливать данные разных форматов
Проводить выборку для уменьшения объема данных
Применять методы математической статистики для обработки первичных данных
Проводить обезличивание первичных данных
Интерпретировать результаты разметки первичных данных

Владеть:

Определение возможных источников данных для анализа, идентификация внешних и внутренних источников данных для проведения аналитических работ
Поиск контекстов и событий в потоке первичных данных
Разметка и кодирование контекстов и событий в потоке первичных данных
Интерпретация контекстов и событий в потоке первичных данных
Автоматизированный анализ первичных данных с классификацией размеченных событий и построением прогностических моделей

ПК-8.п. Способен использовать одну или несколько сквозных цифровых субтехнологий искусственного интеллекта
Знать:

Методы математической статистики
Принципы работы и особенности применения нейронных сетей для анализа данных
Методы семантического анализа
Требования законодательства Российской Федерации о защите персональных данных
Требования законодательства Российской Федерации о защите интеллектуальной собственности
Методы и средства защиты информации
Алгоритмы очистки данных цифрового следа (поиск аномалий, корректировка, подсказка, автоматизация/уменьшение объема ручной работы, поиск дубликатов)
Специализированное программное обеспечение для анализа данных
Способы визуализации данных
Программное обеспечение для визуализации данных
Языки программирования
Математическая статистика
Методы проверки целостности данных
Методы устранения шумов, пустот и элементов, затрудняющих распознавание цифрового следа
Методы структурирования наборов данных

Уметь:

Преобразовывать и подготавливать данные разных форматов
Проводить выборку для уменьшения объема данных
Применять методы математической статистики для обработки первичных данных
Интерпретировать результаты разметки первичных данных
Проводить обезличивание первичных данных
Применять алгоритмы очистки данных цифрового следа (поиск аномалий, корректировка, подсказка, автоматизация/уменьшение объема ручной работы, поиск дубликатов)
Применять специализированное программное обеспечение для анализа данных
Проводить сравнительный анализ для проверки гипотез, представленных в модели деятельности человека (группы людей) и ИКС
Подбирать способы визуализации данных
Применять программное обеспечение для визуализации данных
Обосновывать результаты анализа данных

Владеть:

Анализ потребностей и целей пользователей (людей, групп людей и ИКС);
Разработка метрик оценки качества цифрового следа
Оценка качества представленного цифрового следа на основе метрик
Очистка данных цифрового следа (поиск аномалий, корректировка, подсказка, автоматизация/ уменьшение объема ручной работы, поиск дубликатов)
Поиск контекстов и событий в потоке первичных данных
Разметка и кодирование контекстов и событий в потоке первичных данных
Интерпретация контекстов и событий в потоке первичных данных
Автоматизированный анализ первичных данных с классификацией размеченных событий и построением прогностических моделей
Автоматизация выявления закономерностей в массивах данных
Экспорт результатов анализа в разных форматах
Выдача комплексных заключений по результатам обработки данных

Требования

Граждане Российской Федерации в возрасте от 18 лет и до достижения возраста, дающего право на страховую пенсию по старости в соответствии с частью 1 статьи 8 Федерального закона «О страховых пенсиях», имеющие среднее профессиональное и (или) высшее образование, либо получающие среднее профессиональное и (или) высшее образование, постоянно проживающие на территории Российской Федерации.
Вступительные испытания являются необходимым условием для зачисления на обучение по Образовательной программе и предусматривает 20 тестовых вопросов по предварительно освоенным дисциплинам. Пороговое значение для успешного прохождения вступительного испытания не менее 65% от общего количества результатов выполнения заданий. 

Требования к оборудованию и ПО слушателей:

  • наличие персонального компьютера или ноутбука (операционная система Windows);
  • наличие доступа в сеть Интернет;
  • наличие гарнитуры, микрофона для видеоконференцсвязи с преподавателями;
  • установленное ПО (возможна установка в процессе обучения).
Предварительное освоение иных дисциплин/курсов /модулей
Предварительное освоение дисциплин: теория вероятности и математическая статистика, информатика, базы данных, алгоритмы и структуры данных, современные информационные технологии.
Иные требования и рекомендации для обучения по программе

Граждане Российской Федерации в возрасте от 18 лет и до достижения возраста, дающего право на страховую пенсию по старости в соответствии с частью 1 статьи 8 Федерального закона «О страховых пенсиях», имеющие среднее профессиональное и (или) высшее образование, либо получающие среднее профессиональное и (или) высшее образование, постоянно проживающие на территории Российской Федерации.
Вступительные испытания являются необходимым условием для зачисления на обучение по Образовательной программе и предусматривает 20 тестовых вопросов по предварительно освоенным дисциплинам. Пороговое значение для успешного прохождения вступительного испытания не менее 65% от общего количества результатов выполнения заданий. 

Требования к оборудованию и ПО слушателей:

  • наличие персонального компьютера или ноутбука (операционная система Windows);
  • наличие доступа в сеть Интернет;
  • наличие гарнитуры, микрофона для видеоконференцсвязи с преподавателями;
  • установленное ПО (возможна установка в процессе обучения).

Модули

свернуть
36ч
Модуль 1 Данные и современные технологические решения
Тема 1.1 Данные и методы обработки данных. Тема 1.2 Развитие искусственного интеллекта в РФ Тема 1.3 Правовые основы работы с данными. Тема 1.4 Количественные и качественные методы обработки данных. Предобработка данных.
54ч
Модуль 3 Основные модели и методы анализа данных на основе искусственного интеллекта
Тема 3.1 Нечеткая логика. Тема 3.2. Нейронные сети Тема 3.3. Эвристические алгоритмы. Тема 3.4. Гибридные модели и методы в ИИ.
36ч
Модуль 5 Технологии анализа больших данных
Тема 5.1 Методы сбора и предобработки больших данных Тема 5.2 Методы и инструменты визуализации Тема 5.3. Средства построения систем работы с большими данными Тема 5.4. Облачные платформы для больших данных
36ч
Модуль 2 Разработка программных решений для анализа данных
Тема 2.1. Основы работы с R. Тема 2.2. Основы работы с Python.
54ч
Модуль 4 Основные модели и методы анализа данных на основе искусственного интеллекта
Тема 4.1. Анализ данных и машинное обучение. Тема 4.2. Методы получения, представления и обработки знаний. Тема 4.3. Технологии анализа текста. Тема 4.4. Технологии анализа изображений, видеоизображений и звука.
34ч
Модуль 6 Прикладной искусственный интеллект
Тема 6.1 Задачи компьютерного зрения Тема 6.2 Рекомендательные системы и интеллектуальные СППР Тема 6.3 Задачи в области обработки естественного языка
36ч
Модуль 1 Данные и современные технологические решения
Тема 1.1 Данные и методы обработки данных. Тема 1.2 Развитие искусственного интеллекта в РФ Тема 1.3 Правовые основы работы с данными. Тема 1.4 Количественные и качественные методы обработки данных. Предобработка данных.
36ч
Модуль 2 Разработка программных решений для анализа данных
Тема 2.1. Основы работы с R. Тема 2.2. Основы работы с Python.
54ч
Модуль 3 Основные модели и методы анализа данных на основе искусственного интеллекта
Тема 3.1 Нечеткая логика. Тема 3.2. Нейронные сети Тема 3.3. Эвристические алгоритмы. Тема 3.4. Гибридные модели и методы в ИИ.
54ч
Модуль 4 Основные модели и методы анализа данных на основе искусственного интеллекта
Тема 4.1. Анализ данных и машинное обучение. Тема 4.2. Методы получения, представления и обработки знаний. Тема 4.3. Технологии анализа текста. Тема 4.4. Технологии анализа изображений, видеоизображений и звука.
36ч
Модуль 5 Технологии анализа больших данных
Тема 5.1 Методы сбора и предобработки больших данных Тема 5.2 Методы и инструменты визуализации Тема 5.3. Средства построения систем работы с большими данными Тема 5.4. Облачные платформы для больших данных
34ч
Модуль 6 Прикладной искусственный интеллект
Тема 6.1 Задачи компьютерного зрения Тема 6.2 Рекомендательные системы и интеллектуальные СППР Тема 6.3 Задачи в области обработки естественного языка

Преподаватели

Шахмаметова

Гюзель Радиковна

ФГБОУ ВО УУНиТ

Заведующая кафедрой вычислительной математики и кибернетики, профессор

Доктор технических наук

Доцент

https://uust.ru/vmk/staff/

Сметанина

Ольга Николаевна

ФГБОУ ВО УУНиТ

Профессор кафедры вычислительной математики и кибернетики

Доктор технических наук

Доцент

Антонов

Вячеслав Викторович

ФГБОУ ВО УУНиТ

Заведующая кафедрой автоматизированные системы управления, профессор

Доктор технических наук

Доцент

Сазонова

Екатерина Юрьевна

ФГБОУ ВО УУНиТ

Доцент кафедры вычислительной математики и кибернетики

Кандидат технических наук

Доцент

Авторизуйтесь чтобы записаться

Профстандарт

Специалист по моделированию, сбору и анализу данных цифрового следа

06.046

Специальность

Аналитик данных (Data Scientist)

Отрасль

Промышленность

Ответственный за программу

dpo_ino_2024@mail.ru

+78002003568