III уровень Большие данные

Основы анализа данных и машинного обучения

Оренбургский государственный университет
72,00 часа длительность
Онлайн формат
Базовый уровень

Описание

Востребованность программы определяется активным применением технологий искусственного интеллекта и машинного обучения в производственных и бизнес процессах самых разных компаний и промышленных производств и потребностью подготовки специалистов, владеющих технологиями анализа данных и машинного обучения.

Основные разделы программы:

  1. Основы языка программирования Python для анализа данных.
  2. Базовые задачи и методы машинного обучения.
  3. Современные нейросетевые архитектуры.
  4. Автоматизация сбора данных и доступа к моделям машинного обучения.

Содержание курса ориентировано на подготовку специалистов, способных использовать современные методы анализа данных и машинного обучения, а также средства языка программирования Python для постановки и решения практических задач в различных предметных областях.  Обучение проводится на основе выполнения практических заданий.

По каждому модулю курса в автоматизированной системе управления обучением Moodle есть тесты двух видов. Промежуточные тесты выполняются после прослушивания лекций и оценивают понимание теоретического материала. Тест содержит от 4 до 6 заданий с выбором варианта ответа или вводом ответа.

Для оценки умений используются практические задания на использование конкретных методов анализа данных и машинного обучения, которые необходимо самостоятельно выполнить в системе Jupiter или Google Colaboratory. Практические задания разработаны в интерактивных блокнотах, которые содержат формулировку заданий и место для вставки кода решения. Практические задания проверяются автоматизированно с помощью итоговых тестов, вопросы которых соответствуют ответам на каждый пункт задания. Кроме того, практические задания прикрепляются в систему Moodle и анализируются преподавателем. По каждому тесту вычисляется средний процент правильных ответов.

Цель программы
формирование компетенции цифровой экономики «Способность эффективно применять современные методы и средства анализа данных и машинного обучения для решения прикладных задач» у квалифицированных специалистов различных областей экономики

Требования

Образование – высшее или среднее профессиональное образование.

Квалификация  - нет требований. 

Наличие опыта профессиональной деятельности – нет требований.  

 Предварительное освоение иных дисциплин/курсов /модулей – требуется владение основами цифровой грамотности и алгоритмизации в объеме школьного курса информатики.

Иные требования и рекомендации для обучения по программе

Образование – высшее или среднее профессиональное образование.

Квалификация  - нет требований. 

Наличие опыта профессиональной деятельности – нет требований.  

 Предварительное освоение иных дисциплин/курсов /модулей – требуется владение основами цифровой грамотности и алгоритмизации в объеме школьного курса информатики.

Модули

свернуть
Модуль 1 Основы языка программирования Python
Модуль 1. Основы языка программирования Python для анализа данных (22 часа) Тема 1.1 Базовые конструкции и типы данных Python (11 часов) Язык программирования Python. Переменные, операции, выражения. Целые, действительные числа. Условия, циклы. Строки. Списки. Словари. Описание функций, создание и использование классов. Отладка программ. Использование интерактивных блокнотов Jupiter Notebooks. Тема 1.2 Работа с наборами данных и визуализация (11 часов) Библиотека NumPy. Операции с векторами и матрицами. Библиотека Pandas. Операции с наборами данных. Загрузка и обработка данных. Конструирование признаков. Фильтрация и сортировка данных. Визуализация данных, основные виды графиков и диаграмм. Библиотекb Matplotlib, Seaborn.
Модуль 3 Современные нейросетевые архитектуры.
Модуль 3. Современные нейросетевые архитектуры (16 часов) Тема 3.1 Искусственные нейронные сети. Многослойный персептрон. Обучение нейросетей (4 часа) Искусственный нейрон. Функции активации. Многослойный персептрон. Обучение нейросетей. Классификация с помощью многослойного персептрона. Библиотека Keras+Tensorflow. Тема 3.2 Сверточные нейронные сети. Классификация изображений. (6 часов) Сверточные нейронные сети. Глубокое обучение. Перенос обучения. Современные архитектуры нейросетей для компьютерного зрения. Тема 3.3 Нейросети в обработке текстов. Предобработка, векторизация, классификация текстов. (6 часов) Предобработка, векторизация текстов. Классификация текстов. Рекуррентные нейронные сети для классификации текстов. Нейросетевые методы обработки текстов.
Модуль 2 Базовые задачи и методы машинного обучения.
Модуль 2. Базовые задачи и методы машинного обучения (22 часа) Тема 2.1 Этапы и основные задачи анализа данных (6 часов) Этапы анализа данных. Виды признаков. Анализ данных и машинное обучение. Обучение с учителем, без учителя, с подкреплением. Основные задачи машинного обучения. Принципы оценки качества моделей машинного обучения. Библиотека SkLearn. Тема 2.2 Задача регрессии, основные методы и оценка качества моделей (6 часов) Задача регрессии. Линейная и полиномиальная регрессия. Функции ошибок. Переобучение и регуляризация. Тема 2.3 Задача классификации, базовые методы, оценка качества, ансамблевые методы (8 часов) Задача классификации. Метрики качества классификации. Метод к ближайших соседей. Логистическая регрессия. Метод опорных векторов. Решающие деревья. Ансамблевые методы. Случайный лес. Градиентный бустинг. Подбор оптимальных гиперпараметров. Тема 2.4 Задача кластеризации, основные методы и оценка качества (6 часов) Задача кластеризации. Метрики кластеризации. Метод к-средних. Метод DBSCAN. Метод t-SNE.
Модуль 4 Сбор данных и доступ к моделям машинного обучения
Модуль 4. Автоматизация сбора данных и доступа к моделям машинного обучения (6 часов) Тема 4.1 Автоматизация сбора данных и доступа к моделям машинного обучения (6 часов) Автоматизация загрузки данных из сети. Разбор HTMl, поиск и выделение информации с веб-страниц. Доступ к данным через API. Разбор XML, JSon. Создание API с помощью фреймворка Flask.
Модуль 1 Основы языка программирования Python
Модуль 1. Основы языка программирования Python для анализа данных (22 часа) Тема 1.1 Базовые конструкции и типы данных Python (11 часов) Язык программирования Python. Переменные, операции, выражения. Целые, действительные числа. Условия, циклы. Строки. Списки. Словари. Описание функций, создание и использование классов. Отладка программ. Использование интерактивных блокнотов Jupiter Notebooks. Тема 1.2 Работа с наборами данных и визуализация (11 часов) Библиотека NumPy. Операции с векторами и матрицами. Библиотека Pandas. Операции с наборами данных. Загрузка и обработка данных. Конструирование признаков. Фильтрация и сортировка данных. Визуализация данных, основные виды графиков и диаграмм. Библиотекb Matplotlib, Seaborn.
Модуль 2 Базовые задачи и методы машинного обучения.
Модуль 2. Базовые задачи и методы машинного обучения (22 часа) Тема 2.1 Этапы и основные задачи анализа данных (6 часов) Этапы анализа данных. Виды признаков. Анализ данных и машинное обучение. Обучение с учителем, без учителя, с подкреплением. Основные задачи машинного обучения. Принципы оценки качества моделей машинного обучения. Библиотека SkLearn. Тема 2.2 Задача регрессии, основные методы и оценка качества моделей (6 часов) Задача регрессии. Линейная и полиномиальная регрессия. Функции ошибок. Переобучение и регуляризация. Тема 2.3 Задача классификации, базовые методы, оценка качества, ансамблевые методы (8 часов) Задача классификации. Метрики качества классификации. Метод к ближайших соседей. Логистическая регрессия. Метод опорных векторов. Решающие деревья. Ансамблевые методы. Случайный лес. Градиентный бустинг. Подбор оптимальных гиперпараметров. Тема 2.4 Задача кластеризации, основные методы и оценка качества (6 часов) Задача кластеризации. Метрики кластеризации. Метод к-средних. Метод DBSCAN. Метод t-SNE.
Модуль 3 Современные нейросетевые архитектуры.
Модуль 3. Современные нейросетевые архитектуры (16 часов) Тема 3.1 Искусственные нейронные сети. Многослойный персептрон. Обучение нейросетей (4 часа) Искусственный нейрон. Функции активации. Многослойный персептрон. Обучение нейросетей. Классификация с помощью многослойного персептрона. Библиотека Keras+Tensorflow. Тема 3.2 Сверточные нейронные сети. Классификация изображений. (6 часов) Сверточные нейронные сети. Глубокое обучение. Перенос обучения. Современные архитектуры нейросетей для компьютерного зрения. Тема 3.3 Нейросети в обработке текстов. Предобработка, векторизация, классификация текстов. (6 часов) Предобработка, векторизация текстов. Классификация текстов. Рекуррентные нейронные сети для классификации текстов. Нейросетевые методы обработки текстов.
Модуль 4 Сбор данных и доступ к моделям машинного обучения
Модуль 4. Автоматизация сбора данных и доступа к моделям машинного обучения (6 часов) Тема 4.1 Автоматизация сбора данных и доступа к моделям машинного обучения (6 часов) Автоматизация загрузки данных из сети. Разбор HTMl, поиск и выделение информации с веб-страниц. Доступ к данным через API. Разбор XML, JSon. Создание API с помощью фреймворка Flask.

Преподаватели

Парфёнов

Денис Игоревич

Оренбургский государственный университет

Шухман

Александр Евгеньевич

Оренбургский государственный университет

Морковина

Эльвира Фаридовна

Оренбургский государственный университет
Авторизуйтесь чтобы записаться

Ответственный за программу

shukhman@gmail.com

+79033987498