III уровень

Анализ данных и машинное обучение

Национальный исследовательский Томский государственный университет
322 часа длительность
Онлайн формат
Базовый уровень
1 поток (закрыт) 10.06-25.11.2024
2 поток (закрыт) 01.07-25.11.2024

Описание

Образовательная программа «Анализ данных и машинное обучение» направлена на развитие и углубление способностей и навыков в области анализа данных, проведения аналитической работы и прогнозирования с применением технологий анализа данных, формирование системных знаний и компетенций, необходимых для профессиональной деятельности с применением технологий Big Data.

Программа направлена на формирование компетенций в соответствии:

- профессиональным стандартом «06.042 Специалист по большим данным», утвержденный приказом Министерства труда и социальной защиты Российской Федерации от 6 июля 2020 года N 405н (А/03.6. Подготовка данных для проведения аналитических работ по исследованию больших данных (уровень квалификации – 6); А/04.6. Проведение аналитического исследования с применением технологий больших данных в соответствии с требованиями заказчика (уровень квалификации – 6));

- профессиональным стандартом «06.046 Специалист по моделированию, сбору и анализу данных цифрового следа», утвержденный приказом Министерства труда и социальной защиты Российской Федерации от 9 июля 2021 года № 462н (B/01.5. Подготовка данных цифрового следа для проведения анализа (уровень квалификации – 5); B/02.5. Проверка гипотез, представленных в модели деятельности человека (группы людей) и ИКС, поиск закономерностей (уровень квалификации – 5); B/04.5. Обработка и анализ данных без предварительной разметки, в том числе машинно-генерируемых данных (уровень квалификации – 5).

Обучение проходит в смешанном формате — предоставляются материалы онлайн-курса, а также проводятся вебинары (в режиме реального времени, и в записи) и консультации.

Программа разработана научно-исследовательской лабораторией прикладного анализа больших данных.

Для реализации программы используются практические кейсы, сформулированные (предоставленные) индустриальными партнерами НИЛПАБД – ООО Компания “Мегапьютер Интеллидженс”, Лаборатория 365, Supl.Biz, Vox Populi

Часов в программе
61 час
лекции
112 часов
практика
145 часов
самостоятельная
4 часа
итоговая аттестация
322 часа
всего
Цель программы
Цель реализации программы: формирование и/или совершенствование компетенций в области анализа данных и применения алгоритмов машинного обучения и искусственного интеллекта для решения прикладных задач
Актуальность
Технологии ИИ существенно трансформируют деятельность компаний и станут главным трендом на Российском рынке в течение десяти лет. Роль технологий ИИ в развитии компании сегодня - это повышение продуктивности бизнес-процессов, понимание компаниями собственных производственных связей и потребностей клиентов, повышение инвестиционной привлекательности бизнеса.
При этом, в обновленной стратегии развития ИИ одним из важнейших вызовов назван дефицит квалифицированных специалистов в области ИИ, в частности, качественных аналитиков и специалистов, которые могут использовать алгоритмы машинного обучения для решения актуальных задач.
Входная диагностика
Тест
Тест предполагает задания как на выбор из предложенных вариантов ответов, так и полные развернутые ответы в зависимости от сложности задачи и её веса в баллах. Такой вариант теста позволяет первично диагностировать знания потенциальных слушателей в области практического анализа данных, теории вероятности и статистики,
линейной алгебры и матанализа, языка программирования Python, а также визуализации данных
Итоговая аттестация 4 часа
Итоговая аттестационная работа, в формате решения практико-ориентированной задачи, и её защита

Компетенции

Профессиональные


ПК-1.р.Способен классифицировать и идентифицировать задачи искусственного интеллекта, выбирать адекватные методы и инструментальные средства решения задач искусственного интеллекта
Знать:

методы, алгоритмы и инструментальные средства искусственного интеллекта;
задачи, которые возможно решать при помощи систем искусственного интеллекта

Уметь:

идентифицировать задачи систем искусственного интеллекта в зависимости от особенностей проблемной и предметной областей
строить задачи и разрабатывать алгоритмы и программные средства для ее решения с использованием методов искусственного интеллекта
формировать требования к решению задач с использованием систем искусственного интеллекта

ПК-4.р.Способен разрабатывать и применять методы машинного обучения для решения задач
Знать:

типы данных и их свойства;
алгоритмы машинного обучения и логику их построения;
статистические и математические алгоритмы, которые лежат в основе моделей машинного обучения

Уметь:

разрабатывать методы машинного обучения в зависимости от решаемой задачи%
определять критерии оценки качества моделей машинного обучения%
определять метрики качества моделей машинного обучения

Владеть:

техническими средствами для построения моделей машинного обучения

ПК-5.р. Способен использовать инструментальные средства для решения задач машинного обучения
Знать:

алгоритмы машинного обучения и логику их построения;
статистические и математические алгоритмы, которые лежат в основе моделей машинного обучения

Уметь:

формулировать задачи анализа данных на языке алгоритмов машинного обучения;
осуществлять оценку и выбор инструментальных средств для решения поставленной задачи;
осуществлять подготовку и разметку структурированных и неструктурированных данных для машинного обучения библиотек языка программирования Python (Pandas, sciPy, NumPY, Matplotlib);
делать выводы и интерпретировать полученные результаты на языке предметной области;
использовать методы машинного обучения в зависимости от решаемой задачи;
оценивать качество построенной модели машинного обучения;
осуществлять построение предсказательных моделей

Владеть:

техническими средствами для построения моделей машинного обучения

ПК-.6.п. Способен осуществлять сбор и подготовку данных для систем искусственного интеллекта
Знать:

алгоритмы сбора данных из открытых источников
библиотеки и фреймворки для осуществления сбора данных;
алгоритмы подготовки (очистки и предобработки) данных для систем ИИ;
проблемы данных и процесс их подготовки

Уметь:

работать с документацией API для сбора данных
определять эффективный алгоритм сбора данных в зависимости от задачи и источника данных;
преобразовывать данные в необходимый формат;
работать с различными форматами и структурами данных;
осуществлять сбор данных с помощью библиотек языка программирования Python (Selenium, Scrapy, Requests, BeautifulSoup);
осуществлять подготовку и разметку структурированных и неструктурированных данных для машинного обучения библиотек языка программирования Python (Pandas, sciPy, NumPY, Matplotlib)

Владеть:

технологиями сбора данных из открытых источников для решения задач машинного обучения;
технологиями подготовки (очистки и предобработки) данных для решения задач машинного обучения

ПК-7.п. Способен выполнять анализ больших данных
Знать:

алгоритмы сбора и обработки данных;
алгоритмы исследовательского анализа данных;
статистические методы и алгоритмы машинного обучения для анализа данных

Уметь:

проводить исследования данных, выявлять закономерности и делать выводы на основе анализа
осуществлять сбор, обработку и анализ различных типов данных;
применять алгоритмы машинного обучения для классификации, сегментации и предиктивной аналитики

Владеть:

технологиями сбора, обработки и представления больших данных

Требования

работа с MS Office (Excel, Word, PowerPoint) и продуктами Google (Документы, Таблицы, Презентации);
рекомендовано знание английского языка не ниже Pre-Intermediate.

Квалификация
среднее профессиональное или высшее образование
Владение необходимыми профессиональными компетенциями
знание основ синтаксиса языка программирования (на выбор: С++, Java, Python и т. п.);
рекомендованы базовые знания математики.
Иные требования и рекомендации для обучения по программе

работа с MS Office (Excel, Word, PowerPoint) и продуктами Google (Документы, Таблицы, Презентации);
рекомендовано знание английского языка не ниже Pre-Intermediate.

Модули

свернуть
30ч
Модуль 1 Введение в анализ данных и машинное обучение
Модуль разработан для изучения методологий разработки аналитических решений с использованием методологий анализа больших данных и машинного обучения.
222ч
Модуль 3 Основы анализа данных
Модуль ориентирован на развитие и углубление способностей и навыков в области анализа данных, проведения аналитической работы и прогнозирования с применением технологий анализа больших данных, формирование системных знаний и компетенций, необходимых для профессиональной деятельности с применением технологий Big Data для решения различных задач. В основе модуля — процессный подход, в основе которого лежит цикл аналитической деятельности, каждый раздел соответствует отдельному этапу.
46ч
Модуль 2 Основы Python для анализа данных
Модуль разработан для изучения синтаксиса языка программирования Python, который является ключевым инструментом для аналитика данных.
20ч
Модуль 4 Стажировка
Стажировка предоставляет возможность применить свои знания на практике и получить первый опыт работы в области построения анализа данных и машинного обучения, а также решения проектных задач в данном направлении
30ч
Модуль 1 Введение в анализ данных и машинное обучение
Модуль разработан для изучения методологий разработки аналитических решений с использованием методологий анализа больших данных и машинного обучения.
46ч
Модуль 2 Основы Python для анализа данных
Модуль разработан для изучения синтаксиса языка программирования Python, который является ключевым инструментом для аналитика данных.
222ч
Модуль 3 Основы анализа данных
Модуль ориентирован на развитие и углубление способностей и навыков в области анализа данных, проведения аналитической работы и прогнозирования с применением технологий анализа больших данных, формирование системных знаний и компетенций, необходимых для профессиональной деятельности с применением технологий Big Data для решения различных задач. В основе модуля — процессный подход, в основе которого лежит цикл аналитической деятельности, каждый раздел соответствует отдельному этапу.
20ч
Модуль 4 Стажировка
Стажировка предоставляет возможность применить свои знания на практике и получить первый опыт работы в области построения анализа данных и машинного обучения, а также решения проектных задач в данном направлении

Преподаватели

Гойко

Вячеслав Леонидович

Национальный исследовательский Томский государственный университет

Мундриевская

Юлия Олеговна

Национальный исследовательский Томский государственный университет

Басина

Полина Александровна

Национальный исследовательский Томский государственный университет

аналитик научно-исследовательской лаборатории прикладного анализа больших данных ТГУ

https://persona.tsu.ru/Home/UserProfile/28116

Петров

Евгений Юрьевич

Национальный исследовательский Томский государственный университет

Абазовская

Анастасия Александровна

Национальный исследовательский Томский государственный университет

лаборант Научно-исследовательской лаборатории прикладного анализа больших данных ТГУ

https://persona.tsu.ru/Home/UserProfile/29275

Кеба

Анастасия Владимировна

Национальный исследовательский Томский государственный университет

учебный мастер кафедры прикладной математики ИПМКН ТГУ

https://persona.tsu.ru/home/UserProfile/28493

Киселёва

Полина Викторовна

Национальный исследовательский Томский государственный университет

доцент кафедры английской филологии ФИЯ ТГУ

Кандидат педагогических наук

Доцент

https://persona.tsu.ru/Home/UserProfile/2120

Кабанова

Татьяна Валерьевна

Национальный исследовательский Томский государственный университет

Доцент кафедры ТВиМС Института прикладной математики и компьютерных наук

Доцент

Кандидат физико-математических наук

https://persona.tsu.ru/Home/UserProfile/15939

Савина

Екатерина Андреевна

Национальный исследовательский Томский государственный университет

Аналитик Центра прикладного анализа больших данных НИ ТГУ

https://persona.tsu.ru/Home/UserProfile/28715

Никитина

Татьяна Владимировна

Газпромнефть-Региональные продажи

Аналитик управления оптовых продаж

Авторизуйтесь чтобы записаться

Профстандарт

Специалист по большим данным

06.042

Специальность

Аналитик данных (Data Scientist)

Ответственный за программу

goiko@data.tsu.ru

+7(952)8889124