Анализ данных и машинное обучение
Национальный исследовательский Томский государственный университет![](https://s3.objstor.cloud4u.com/unti-prod-cat/CACHE/images/cover/82.1712830097/bdf65dce7ca463ed0cddaf216f5d74bc.jpg)
Описание
Образовательная программа «Анализ данных и машинное обучение» направлена на развитие и углубление способностей и навыков в области анализа данных, проведения аналитической работы и прогнозирования с применением технологий анализа данных, формирование системных знаний и компетенций, необходимых для профессиональной деятельности с применением технологий Big Data.
Программа направлена на формирование компетенций в соответствии:
- профессиональным стандартом «06.042 Специалист по большим данным», утвержденный приказом Министерства труда и социальной защиты Российской Федерации от 6 июля 2020 года N 405н (А/03.6. Подготовка данных для проведения аналитических работ по исследованию больших данных (уровень квалификации – 6); А/04.6. Проведение аналитического исследования с применением технологий больших данных в соответствии с требованиями заказчика (уровень квалификации – 6));
- профессиональным стандартом «06.046 Специалист по моделированию, сбору и анализу данных цифрового следа», утвержденный приказом Министерства труда и социальной защиты Российской Федерации от 9 июля 2021 года № 462н (B/01.5. Подготовка данных цифрового следа для проведения анализа (уровень квалификации – 5); B/02.5. Проверка гипотез, представленных в модели деятельности человека (группы людей) и ИКС, поиск закономерностей (уровень квалификации – 5); B/04.5. Обработка и анализ данных без предварительной разметки, в том числе машинно-генерируемых данных (уровень квалификации – 5).
Обучение проходит в смешанном формате — предоставляются материалы онлайн-курса, а также проводятся вебинары (в режиме реального времени, и в записи) и консультации.
Программа разработана научно-исследовательской лабораторией прикладного анализа больших данных.
Для реализации программы используются практические кейсы, сформулированные (предоставленные) индустриальными партнерами НИЛПАБД – ООО Компания “Мегапьютер Интеллидженс”, Лаборатория 365, Supl.Biz, Vox Populi
Часов в программе
Цель программы
Актуальность
При этом, в обновленной стратегии развития ИИ одним из важнейших вызовов назван дефицит квалифицированных специалистов в области ИИ, в частности, качественных аналитиков и специалистов, которые могут использовать алгоритмы машинного обучения для решения актуальных задач.
Входная диагностика
Тест предполагает задания как на выбор из предложенных вариантов ответов, так и полные развернутые ответы в зависимости от сложности задачи и её веса в баллах. Такой вариант теста позволяет первично диагностировать знания потенциальных слушателей в области практического анализа данных, теории вероятности и статистики,
линейной алгебры и матанализа, языка программирования Python, а также визуализации данных
Итоговая аттестация 4 часа
Компетенции
Профессиональные
ПК-1.р.Способен классифицировать и идентифицировать задачи искусственного интеллекта, выбирать адекватные методы и инструментальные средства решения задач искусственного интеллекта
методы, алгоритмы и инструментальные средства искусственного интеллекта;
задачи, которые возможно решать при помощи систем искусственного интеллекта
идентифицировать задачи систем искусственного интеллекта в зависимости от особенностей проблемной и предметной областей
строить задачи и разрабатывать алгоритмы и программные средства для ее решения с использованием методов искусственного интеллекта
формировать требования к решению задач с использованием систем искусственного интеллекта
ПК-4.р.Способен разрабатывать и применять методы машинного обучения для решения задач
типы данных и их свойства;
алгоритмы машинного обучения и логику их построения;
статистические и математические алгоритмы, которые лежат в основе моделей машинного обучения
разрабатывать методы машинного обучения в зависимости от решаемой задачи%
определять критерии оценки качества моделей машинного обучения%
определять метрики качества моделей машинного обучения
техническими средствами для построения моделей машинного обучения
ПК-5.р. Способен использовать инструментальные средства для решения задач машинного обучения
алгоритмы машинного обучения и логику их построения;
статистические и математические алгоритмы, которые лежат в основе моделей машинного обучения
формулировать задачи анализа данных на языке алгоритмов машинного обучения;
осуществлять оценку и выбор инструментальных средств для решения поставленной задачи;
осуществлять подготовку и разметку структурированных и неструктурированных данных для машинного обучения библиотек языка программирования Python (Pandas, sciPy, NumPY, Matplotlib);
делать выводы и интерпретировать полученные результаты на языке предметной области;
использовать методы машинного обучения в зависимости от решаемой задачи;
оценивать качество построенной модели машинного обучения;
осуществлять построение предсказательных моделей
техническими средствами для построения моделей машинного обучения
ПК-.6.п. Способен осуществлять сбор и подготовку данных для систем искусственного интеллекта
алгоритмы сбора данных из открытых источников
библиотеки и фреймворки для осуществления сбора данных;
алгоритмы подготовки (очистки и предобработки) данных для систем ИИ;
проблемы данных и процесс их подготовки
работать с документацией API для сбора данных
определять эффективный алгоритм сбора данных в зависимости от задачи и источника данных;
преобразовывать данные в необходимый формат;
работать с различными форматами и структурами данных;
осуществлять сбор данных с помощью библиотек языка программирования Python (Selenium, Scrapy, Requests, BeautifulSoup);
осуществлять подготовку и разметку структурированных и неструктурированных данных для машинного обучения библиотек языка программирования Python (Pandas, sciPy, NumPY, Matplotlib)
технологиями сбора данных из открытых источников для решения задач машинного обучения;
технологиями подготовки (очистки и предобработки) данных для решения задач машинного обучения
ПК-7.п. Способен выполнять анализ больших данных
алгоритмы сбора и обработки данных;
алгоритмы исследовательского анализа данных;
статистические методы и алгоритмы машинного обучения для анализа данных
проводить исследования данных, выявлять закономерности и делать выводы на основе анализа
осуществлять сбор, обработку и анализ различных типов данных;
применять алгоритмы машинного обучения для классификации, сегментации и предиктивной аналитики
технологиями сбора, обработки и представления больших данных
Требования
работа с MS Office (Excel, Word, PowerPoint) и продуктами Google (Документы, Таблицы, Презентации);
рекомендовано знание английского языка не ниже Pre-Intermediate.
Квалификация
Владение необходимыми профессиональными компетенциями
рекомендованы базовые знания математики.
Иные требования и рекомендации для обучения по программе
работа с MS Office (Excel, Word, PowerPoint) и продуктами Google (Документы, Таблицы, Презентации);
рекомендовано знание английского языка не ниже Pre-Intermediate.
Модули
свернутьПреподаватели
![](https://s3.objstor.cloud4u.com/unti-prod-cat/CACHE/images/instructor/82.1602661273/e421f7da80c15cbd8a70058a7ada8df7.jpg)
Гойко
Вячеслав Леонидович
Национальный исследовательский Томский государственный университет
![](https://s3.objstor.cloud4u.com/unti-prod-cat/CACHE/images/instructor/82.1602661337/d9a73b2323cc4b469cac22c46a079290.jpg)
Мундриевская
Юлия Олеговна
Национальный исследовательский Томский государственный университет
![](https://s3.objstor.cloud4u.com/unti-prod-cat/CACHE/images/instructor/82.1681029992/05b24e336ab14cc8d4842a2ba5a35c75.jpg)
Басина
Полина Александровна
Национальный исследовательский Томский государственный университет
аналитик научно-исследовательской лаборатории прикладного анализа больших данных ТГУ
https://persona.tsu.ru/Home/UserProfile/28116![](https://s3.objstor.cloud4u.com/unti-prod-cat/CACHE/images/instructor/82.1602661402/5cf514bb898901c82c714c70f7785344.jpg)
Петров
Евгений Юрьевич
Национальный исследовательский Томский государственный университет
![](https://s3.objstor.cloud4u.com/unti-prod-cat/CACHE/images/instructor/82.1681030097/ba5b432ada60d5aa7279ad43e38ee8e9.jpg)
Абазовская
Анастасия Александровна
Национальный исследовательский Томский государственный университет
лаборант Научно-исследовательской лаборатории прикладного анализа больших данных ТГУ
https://persona.tsu.ru/Home/UserProfile/29275![](https://s3.objstor.cloud4u.com/unti-prod-cat/CACHE/images/instructor/82.1681030577/aec7a939b0d5ece803c42a13969eea08.jpg)
Кеба
Анастасия Владимировна
Национальный исследовательский Томский государственный университет
учебный мастер кафедры прикладной математики ИПМКН ТГУ
https://persona.tsu.ru/home/UserProfile/28493![](https://s3.objstor.cloud4u.com/unti-prod-cat/CACHE/images/instructor/82.1681030643/622fc803927afeaf985db784873b010e.jpg)
Киселёва
Полина Викторовна
Национальный исследовательский Томский государственный университет
доцент кафедры английской филологии ФИЯ ТГУ
Кандидат педагогических наук
Доцент
https://persona.tsu.ru/Home/UserProfile/2120![](https://s3.objstor.cloud4u.com/unti-prod-cat/CACHE/images/instructor/82.1681030808/1137793b04f79ef8c0ea284c24755224.jpg)
Кабанова
Татьяна Валерьевна
Национальный исследовательский Томский государственный университет
Доцент кафедры ТВиМС Института прикладной математики и компьютерных наук
Доцент
Кандидат физико-математических наук
https://persona.tsu.ru/Home/UserProfile/15939![](https://s3.objstor.cloud4u.com/unti-prod-cat/CACHE/images/instructor/82.1681030856/b0d41026d684eae6b0a549f7140832db.jpg)
Савина
Екатерина Андреевна
Национальный исследовательский Томский государственный университет
Аналитик Центра прикладного анализа больших данных НИ ТГУ
https://persona.tsu.ru/Home/UserProfile/28715![](https://s3.objstor.cloud4u.com/unti-prod-cat/CACHE/images/instructor/82.1681030733/9213ea9c3dce2a53b22375e479dcb924.jpg)
Никитина
Татьяна Владимировна
Газпромнефть-Региональные продажи
Аналитик управления оптовых продаж
Профстандарт
Специалист по большим данным
06.042Специальность
Аналитик данных (Data Scientist)
Ответственный за программу
+7(952)8889124