Востребованность программы определяется активным применением технологий искусственного интеллекта и машинного обучения в производственных и бизнес процессах самых разных компаний и промышленных производств и потребностью подготовки специалистов, владеющих технологиями анализа данных и машинного обучения.
Основные разделы программы:
- Основы языка программирования Python для анализа данных.
- Базовые задачи и методы машинного обучения.
- Современные нейросетевые архитектуры.
- Автоматизация сбора данных и доступа к моделям машинного обучения.
Содержание курса ориентировано на подготовку специалистов, способных использовать современные методы анализа данных и машинного обучения, а также средства языка программирования Python для постановки и решения практических задач в различных предметных областях. Обучение проводится на основе выполнения практических заданий.
По каждому модулю курса в автоматизированной системе управления обучением Moodle есть тесты двух видов. Промежуточные тесты выполняются после прослушивания лекций и оценивают понимание теоретического материала. Тест содержит от 4 до 6 заданий с выбором варианта ответа или вводом ответа.
Для оценки умений используются практические задания на использование конкретных методов анализа данных и машинного обучения, которые необходимо самостоятельно выполнить в системе Jupiter или Google Colaboratory. Практические задания разработаны в интерактивных блокнотах, которые содержат формулировку заданий и место для вставки кода решения. Практические задания проверяются автоматизированно с помощью итоговых тестов, вопросы которых соответствуют ответам на каждый пункт задания. Кроме того, практические задания прикрепляются в систему Moodle и анализируются преподавателем. По каждому тесту вычисляется средний процент правильных ответов.
формирование компетенции цифровой экономики «Способность эффективно применять современные методы и средства анализа данных и машинного обучения для решения прикладных задач» у квалифицированных специалистов различных областей экономики
Образование – высшее или среднее профессиональное образование.
Квалификация - нет требований.
Наличие опыта профессиональной деятельности – нет требований.
Предварительное освоение иных дисциплин/курсов /модулей – требуется владение основами цифровой грамотности и алгоритмизации в объеме школьного курса информатики.
Образование – высшее или среднее профессиональное образование.
Квалификация - нет требований.
Наличие опыта профессиональной деятельности – нет требований.
Предварительное освоение иных дисциплин/курсов /модулей – требуется владение основами цифровой грамотности и алгоритмизации в объеме школьного курса информатики.
свернуть
Модуль 1. Основы языка программирования Python для анализа данных (22 часа)
Тема 1.1 Базовые конструкции и типы данных Python (11 часов)
Язык программирования Python. Переменные, операции, выражения. Целые, действительные числа. Условия, циклы. Строки. Списки. Словари. Описание функций, создание и использование классов. Отладка программ. Использование интерактивных блокнотов Jupiter Notebooks.
Тема 1.2 Работа с наборами данных и визуализация (11 часов)
Библиотека NumPy. Операции с векторами и матрицами. Библиотека Pandas. Операции с наборами данных. Загрузка и обработка данных. Конструирование признаков. Фильтрация и сортировка данных. Визуализация данных, основные виды графиков и диаграмм. Библиотекb Matplotlib, Seaborn.
Модуль 3. Современные нейросетевые архитектуры (16 часов)
Тема 3.1 Искусственные нейронные сети. Многослойный персептрон. Обучение нейросетей (4 часа)
Искусственный нейрон. Функции активации. Многослойный персептрон. Обучение нейросетей. Классификация с помощью многослойного персептрона. Библиотека Keras+Tensorflow.
Тема 3.2 Сверточные нейронные сети. Классификация изображений. (6 часов)
Сверточные нейронные сети. Глубокое обучение. Перенос обучения. Современные архитектуры нейросетей для компьютерного зрения.
Тема 3.3 Нейросети в обработке текстов. Предобработка, векторизация, классификация текстов. (6 часов)
Предобработка, векторизация текстов. Классификация текстов. Рекуррентные нейронные сети для классификации текстов. Нейросетевые методы обработки текстов.
Модуль 2. Базовые задачи и методы машинного обучения (22 часа)
Тема 2.1 Этапы и основные задачи анализа данных (6 часов)
Этапы анализа данных. Виды признаков. Анализ данных и машинное обучение. Обучение с учителем, без учителя, с подкреплением. Основные задачи машинного обучения. Принципы оценки качества моделей машинного обучения. Библиотека SkLearn.
Тема 2.2 Задача регрессии, основные методы и оценка качества моделей (6 часов)
Задача регрессии. Линейная и полиномиальная регрессия. Функции ошибок. Переобучение и регуляризация.
Тема 2.3 Задача классификации, базовые методы, оценка качества, ансамблевые методы (8 часов)
Задача классификации. Метрики качества классификации. Метод к ближайших соседей. Логистическая регрессия. Метод опорных векторов. Решающие деревья. Ансамблевые методы. Случайный лес. Градиентный бустинг. Подбор оптимальных гиперпараметров.
Тема 2.4 Задача кластеризации, основные методы и оценка качества (6 часов)
Задача кластеризации. Метрики кластеризации. Метод к-средних. Метод DBSCAN. Метод t-SNE.
Модуль 4. Автоматизация сбора данных и доступа к моделям машинного обучения (6 часов)
Тема 4.1 Автоматизация сбора данных и доступа к моделям машинного обучения (6 часов)
Автоматизация загрузки данных из сети. Разбор HTMl, поиск и выделение информации с веб-страниц. Доступ к данным через API. Разбор XML, JSon. Создание API с помощью фреймворка Flask.
Модуль 1. Основы языка программирования Python для анализа данных (22 часа)
Тема 1.1 Базовые конструкции и типы данных Python (11 часов)
Язык программирования Python. Переменные, операции, выражения. Целые, действительные числа. Условия, циклы. Строки. Списки. Словари. Описание функций, создание и использование классов. Отладка программ. Использование интерактивных блокнотов Jupiter Notebooks.
Тема 1.2 Работа с наборами данных и визуализация (11 часов)
Библиотека NumPy. Операции с векторами и матрицами. Библиотека Pandas. Операции с наборами данных. Загрузка и обработка данных. Конструирование признаков. Фильтрация и сортировка данных. Визуализация данных, основные виды графиков и диаграмм. Библиотекb Matplotlib, Seaborn.
Модуль 2. Базовые задачи и методы машинного обучения (22 часа)
Тема 2.1 Этапы и основные задачи анализа данных (6 часов)
Этапы анализа данных. Виды признаков. Анализ данных и машинное обучение. Обучение с учителем, без учителя, с подкреплением. Основные задачи машинного обучения. Принципы оценки качества моделей машинного обучения. Библиотека SkLearn.
Тема 2.2 Задача регрессии, основные методы и оценка качества моделей (6 часов)
Задача регрессии. Линейная и полиномиальная регрессия. Функции ошибок. Переобучение и регуляризация.
Тема 2.3 Задача классификации, базовые методы, оценка качества, ансамблевые методы (8 часов)
Задача классификации. Метрики качества классификации. Метод к ближайших соседей. Логистическая регрессия. Метод опорных векторов. Решающие деревья. Ансамблевые методы. Случайный лес. Градиентный бустинг. Подбор оптимальных гиперпараметров.
Тема 2.4 Задача кластеризации, основные методы и оценка качества (6 часов)
Задача кластеризации. Метрики кластеризации. Метод к-средних. Метод DBSCAN. Метод t-SNE.
Модуль 3. Современные нейросетевые архитектуры (16 часов)
Тема 3.1 Искусственные нейронные сети. Многослойный персептрон. Обучение нейросетей (4 часа)
Искусственный нейрон. Функции активации. Многослойный персептрон. Обучение нейросетей. Классификация с помощью многослойного персептрона. Библиотека Keras+Tensorflow.
Тема 3.2 Сверточные нейронные сети. Классификация изображений. (6 часов)
Сверточные нейронные сети. Глубокое обучение. Перенос обучения. Современные архитектуры нейросетей для компьютерного зрения.
Тема 3.3 Нейросети в обработке текстов. Предобработка, векторизация, классификация текстов. (6 часов)
Предобработка, векторизация текстов. Классификация текстов. Рекуррентные нейронные сети для классификации текстов. Нейросетевые методы обработки текстов.
Модуль 4. Автоматизация сбора данных и доступа к моделям машинного обучения (6 часов)
Тема 4.1 Автоматизация сбора данных и доступа к моделям машинного обучения (6 часов)
Автоматизация загрузки данных из сети. Разбор HTMl, поиск и выделение информации с веб-страниц. Доступ к данным через API. Разбор XML, JSon. Создание API с помощью фреймворка Flask.
Парфёнов
Денис Игоревич
Оренбургский государственный университет
Шухман
Александр Евгеньевич
Оренбургский государственный университет
Морковина
Эльвира Фаридовна
Оренбургский государственный университет