Процедурно-ориентированное программирование в прикладных задачах анализа данных в экономике
Федеральное государственное бюджетное образовательное учреждение высшего образования "Российский экономический университет имени Г.В. Плеханова"
Описание
В рамках данной программы подразумевается изучение принципов разработки моделей машинного обучения с использованием библиотек python 3 для осуществления поддержки принятия управленческих решений в компаниях. Осваиваемые компетенции подходит для лиц, не имеющих специальных навыков и опыта в программировании и знаний статистики, что делает ее доступной широкому кругу слушателей.
Курс включает в себя изучение основных языковых конструкций языка Python 3, а так же получения практических навыков работы с библиотеками: NumPy, Pandas, Scikit-learn, Keras и TensorFlow. Так же в курсе рассматриваются библиотеки визуализации данных Seaborn и Matplotlib. Слушатели получат навыки работы со средой разработки Spyder, а также с интерактивной облачной средой Google Colab. Слушатели будут ознакомлены с принципами стандарта CRISP-DM для понимания жизненного цикла исследования данных.
Для оценки уровня освоения полученных в процессе обучения компетенций слушатели будут выполнять проекты по экономической тематике с использованием языка Python, состоящий из следующих этапов (согласно с целями стандарта CRISP-DM:
- Постановка бизнес-задачи (определение бизнес-целей, оценка текущей ситуации, определение целей аналитики, подготовка плана анализа данных);
- Начальное изучение данных (сбор данных, описание данных, изучение данных проверка качества данных);
- Подготовка данных (Очистка данных, генерация данных, интеграция данных, форматирование данных)
- Моделирование (выбор алгоритмов, подготовка плана тестирования, обучение моделей, проверка качества моделей)
- Оценка (оценка результатов, оценка процесса, определение следующих шагов)
- Внедрение (планирование мониторинга и поддержки, подготовка отчета, ревью проекта)
В результате освоения данной программы выпускник программы «Процедурно-ориентированное программирование в прикладных задачах анализа данных в экономике» должен:
Знать:
- Основные понятия и принципы Data mining;
- Структуру работ при выполнении работ по анализу данных согласно стандарту CRISP-DM
- Основные операторы языка Python;
- Основные типы данных языка программирования Python (в том числе понимание динамической типизации)
- Синтаксис создания переменных в языке Python
- Принцип работы встроенной функции вывода в консоль
- Синтаксис создания комментариев
- Синтаксис создания условного потока с использованием выражения if/else
- Понятие логических переменных при создании условных потоков
- Принципы использования логических операторов при составлении условий
- Принципы использования выражений try и except при проверке ошибок
- Понятия и способы задания строк в Python
- Функции работы со строками, встроенные в языке Python
- Принципы индексации строк и способы создания срезов строк
- Принцип иммутабельности строк
- Основные escape последовательности и синтаксис их применения в языке Python
- Синтаксис и принципы применения итерационных циклов с использованием конструкции for в языке Python
- Синтаксис и принципы применения циклов с выполнением условия с использованием конструкции while
- Способы создания списков в языке Python
- Функции работы со списком в языке Python
- Отличия списка от кортежа в языке Python
- Основное назначение функций в языках программирования
- Синтаксис и принципы создания функций в языке Python
- Синтаксис подключения библиотек в языке Python
- Понятие пространства имен и его назначение
- Понятие словарей в языке Python
- Синтаксис создания словарей в Python
- Использовать встроенные функции для работы со словарями в языке Python
- Основные форматы файлов данных, используемых в языке
- Синтаксис работы с файлами в языке Python
- Основные элементы и функции библиотеки NumPy
- Способы предварительного исследования данных с использованием библиотеки NumPy
- Методы и средства очистки данных в NumPy
- Основные элементы и функции библиотеки Pandas
- Способы предварительного исследования данных с использованием библиотеки Pandas
- Способы загрузки данных с использованием библиотеки Pandas
- Знать основные возможности построения визуализации посредством библиотек Matplotlib и Seaborn
- Основные инструменты библиотеки Scikit-learn для осуществления построения моделей машинного обучения
- Основные инструменты библиотеки TensorFlow для осуществления построения моделей искусственных нейронных сетей
- Основные способы оценки построенных моделей;
- Инструментарий библиотек машинного обучения языка Python 3 для проведения верификации моделей
Уметь:
- Планировать работы по проведению анализа данных с целью повышения эффективности управленческих решений;
- Выполнять простые математические вычисления на языке Python
- Выводить в консоль данные
- Создавать контролируемые потоки кода с использованием конструкций if/else
- Применять условные переменные при создании контролируемых потоков
- Использовать логические операторы при составлении сложных условий
- Проверять возможные ошибки при выполнении кода с использованием конструкции try и except
- Создавать строки на языке Python
- Применять встроенные функции работы со строками в языке Python
- Создавать срезы строк с использованием значений индексов строки
- Применять escape последовательности и синтаксис их применения в языке Python
- Создавать переменные и присваивать им значения различных типов данных
- Использовать среды разработки Spyder и Google colab для разработки на языке Python;
- Создавать итерационные циклы с использованием конструкции for в языке Python
- Создавать итерационные циклы с выполнением условия с использованием конструкции while в языке Python
- Создавать списки в языке Python
- Осуществлять работу со списками с использованием встроенных функций в языке Python
- Разделять исходную функциональность на функции
- Задавать функции с использованием синтаксиса языка Python
- Подключать библиотеки и модули языка Python
- Создавать Словари в языке Python
- Уметь редактировать созданные словари в языке Python
- Использовать встроенные функции для работы со словарями в языке Python
- Работать с файлами формата csv и json в языке Python
- Использовать библиотеку NumPy для предварительного анализа данных
- Использовать библиотеку NumPy для очистки данных
- Осуществлять матричные вычисления с использованием NumPy
- Использовать библиотеку Pandas для предварительного анализа данных
- Использовать библиотеку Pandas для очистки данных
- Использовать библиотеку Pandas для загрузки и манипулировании данных
- Использовать библиотеки Matplotlib и Seaborn для визуализации данных;
- Использовать библиотеку Scikit-learn для построения моделей машинного обучения;
- Использовать библиотеки TensorFlow и Keras для построения моделей машинного обучения;
- Использование библиотек Python для проведения верификации моделей;
Владеть:
- Навыками использования стандарта CRISP-DM
- Навыками создания переменных различных типов
- Навыками вывода данных в консоль
- Навыками применения операторов языка Python для выполнения вычислений
- Навыками создания условных потоков с использованием конструкций if/else
- Навыками создания условий с использованием условных операторов
- Навыками создания условных потоков с использованием конструкций try и except
- Навыками создания строк языке Python
- Навыками применения встроенных функций работы со строками языке Python
- Навыками создания срезов строк
- Навыками применения escape последовательности в языке Python
- Навыками применения цикла for для решения задач в языке Python
- Навыками применения цикла while для решения задач в языке Python
- Навыками работы со списками в языке Python
- Навыком применения встроенных функций работы со списками в языке Python
- Навыками структурирования кода с использованием функций
- Навыками создания функций в языке Python
- Навыками подключения библиотек Python
- Навыками создания словарей для решения задач
- Навыками использования встроенных функций для работы со словарями в языке Python
- Навыками использования встроенных функций Python для работы с файлами
- Навыками применения библиотеки NumPy в анализе данных
- Навыками применения библиотеки Pandas в анализе данных
- Навыками работы с библиотеками визуализации данных Matplotlib и seaborn.
- Навыками работы с библиотеками Scikit-learn для решения задач анализа данных
- Навыками построения искусственных нейронных сетей с использованием библиотеки TensorFlow и Keras
- Навыками проведения верификации с использованием библиотек языка Python;
Часов в программе
Цель программы
Актуальность
В условиях цифровой трансформации бизнеса и переходу стратегий, основанных на данных, необходимо повышать грамотность представителей бизнеса в области инструментария работы с данными, а также принципов моделирования.
Чего ждут работодатели
Самый популярный навык — владение Python. Это требование встречается в 45% вакансий специалистов по анализу данных и в половине (51%) вакансий в области машинного обучения.
Также работодатели хотят, чтобы специалисты по анализу данных знали SQL (23%), владели интеллектуальным анализом данных (Data Mining) (19%), математической статистикой (11%) и умели работать с большими данными (10%).
Работодатели, которые ищут специалистов по машинному обучению, наряду со знанием Python ожидают, что кандидат будет владеть C++ (18%), SQL (15%), алгоритмами машинного обучения (13%) и Linux (11%).
Входная диагностика 2 часа
Итоговая аттестация 24 часа
Компетенции
Общекультурные
Культура планирования работ по проведению анализа данных согласно стандарту CRISP-DM
• Основные понятия и принципы Data mining;
• Структуру работ при выполнении работ по анализу данных согласно стандарту CRISP-DM
• Планировать работы по проведению анализа данных с целью повышения эффективности управленческих решений;
Владеть:• Навыками использования стандарта CRISP-DM (Cross-Industry Standard Process for Data Mining)
Профессиональные
Умение осуществлять построение моделей машинного обучения с использованием библиотеки Sickit-learn
Основные инструменты библиотеки Scikit-learn для осуществления построения моделей машинного обучения.
Уметь:Использовать библиотеку Scikit-learn для построения моделей машинного обучения.
Владеть:Навыками работы с библиотеками Scikit-learn для решения задач анализа данных.
Навык использования базового синтаксиса языка Python
Основные операторы языка Python.
Основные типы данных языка программирования Python (в том числе понимание динамической типизации).
Синтаксис создания переменных в языке Python.
Принцип работы встроенной функции вывода в консоль.
Синтаксис создания комментариев.
Выполнять простые математические вычисления на языке Python.
Выводить в консоль данные.
Создавать переменные и присваивать им значения различных типов данных.
Использовать среды разработки Spyder и Google colab для разработки на языке Python.
Навыками создания переменных различных типов.
Навыками вывода данных в консоль.
Навыками применения операторов языка Python для выполнения вычислений.
Навыки создания и использования условных потоков исполнения кода
Синтаксис создания условного потока с использованием выражения if/else.
Понятие логических переменных при создании условных потоков.
Принципы использования логических операторов при составлении условий.
Принципы использования выражений try и except при проверке ошибок.
Создавать контролируемые потоки кода с использованием конструкций if/else.
Применять условные переменные при создании контролируемых потоков.
Использовать логические операторы при составлении сложных условий.
Проверять возможные ошибки при выполнении кода с использованием конструкции try и except.
Навыками создания условных потоков с использованием конструкций if/else.
Навыками создания условий с использованием условных операторов.
Навыками создания условных потоков с использованием конструкций try и except.
Навык работы с встроенными функциями создания и обработки строк в языке Python
Понятия и способы задания строк в Python.
Функции работы со строками, встроенные в языке Python.
Принципы индексации строк и способы создания срезов строк.
Принцип иммутабельности строк.
Основные escape последовательности и синтаксис их применения в языке Python.
Создавать строки на языке Python.
Применять встроенные функции работы со строками в языке Python.
Создавать срезы строк с использованием значений индексов строки.
Применять escape последовательности и синтаксис их применения в языке Python.
Навыками создания строк языке Python.
Навыками применения встроенных функций работы со строками языке Python.
Навыками создания срезов строк.
Навыками применения escape последовательности в языке Python.
Навык создания и применения циклов в языке Python
Синтаксис и принципы применения итерационных циклов с использованием конструкции for в языке Python.
Синтаксис и принципы применения циклов с выполнением условия с использованием конструкции while.
Создавать итерационные циклы с использованием конструкции for в языке Python.
Создавать итерационные циклы с выполнением условия с использованием конструкции while в языке Python.
Навыками применения цикла for для решения задач в языке Python.
Навыками применения цикла while для решения задач в языке Python.
Навык работы со списками с использованием встроенного инструментария Python
Способы создания списков в языке Python.
Функции работы со списком в языке Python.
Отличия списка от кортежа в языке Python.
Создавать списки в языке Python.
Осуществлять работу со списками с использованием встроенных функций в языке Python.
Навыками работы со списками в языке Python.
Навыком применения встроенных функций работы со списками в языке Python.
Навык использования функций в языке Python
Основное назначение функций в языках программирования.
Синтаксис и принципы создания функций в языке Python.
Разделять исходную функциональность на функции.
Задавать функции с использованием синтаксиса языка Python.
Навыками структурирования кода с использованием функций.
Навыками создания функций в языке Python.
Навык подключения внешних библиотек на языке Python
Синтаксис подключения библиотек в языке Python.
Понятие пространства имен и его назначение.
Уметь подключать библиотеки и модули языка Python.
Владеть:Обладать навыками подключения библиотек Python.
Навык использования словарей в Python
Понятие словарей в языке Python.
Синтаксис создания словарей в Python.
Использовать встроенные функции для работы со словарями в языке Python.
Создавать Словари в языке Python.
Уметь редактировать созданные словари в языке Python.
Использовать встроенные функции для работы со словарями в языке Python.
Навыками создания словарей для решения задач.
Навыками использования встроенных функций для работы со словарями в языке Python.
Навыки работы с файлами средствами языка Python
Основные форматы файлов данных, используемых в языке .
Синтаксис работы с файлами в языке Python.
Работать с файлами формата csv и json в языке Python.
Владеть:Навыками использования встроенных функций Python для работы с файлами.
Навык работы в библиотеке NumPy
Основные элементы и функции библиотеки NumPy.
Способы предварительного исследования данных с использованием библиотеки NumPy.
Методы и средства очистки данных в NumPy.
Использовать библиотеку NumPy для предварительного анализа данных.
Использовать библиотеку NumPy для очистки данных.
Осуществлять матричные вычисления с использованием NumPy.
Навыками применения библиотеки NumPy в анализе данных.
Навык работы в библиотеке Pandas
Основные элементы и функции библиотеки Pandas.
Способы предварительного исследования данных с использованием библиотеки Pandas.
Способы загрузки данных с использованием библиотеки Pandas.
Использовать библиотеку Pandas для предварительного анализа данных.
Использовать библиотеку Pandas для очистки данных.
Использовать библиотеку Pandas для загрузки и манипулировании данных.
Навыками применения библиотеки Pandas в анализе данных.
Навык использования средств визуализации данных с помощью библиотек Matplotlib и Seaborn
Знать основные возможности построения визуализации посредством библиотек Matplotlib и Seaborn.
Уметь:Использовать библиотеки Matplotlib и Seaborn для визуализации данных.
Владеть:Навыками работы с библиотеками визуализации данных Matplotlib и seaborn.
Умение осуществлять построение моделей машинного обучения с использованием библиотеки TensorFlow и Keras
Основные инструменты библиотеки TensorFlow для осуществления построения моделей искусственных нейронных сетей.
Уметь:Использовать библиотеки TensorFlow и Keras для построения моделей машинного обучения.
Владеть:Навыками построения искусственных нейронных сетей с использованием библиотеки TensorFlow и Keras.
Умение использовать язык Python для проведения верификации моделей
Основные способы оценки построенных моделей.
Инструментарий библиотек машинного обучения языка Python 3 для проведения верификации моделей.
Использование библиотек Python для проведения верификации моделей.
Владеть:Навыками проведения верификации с использованием библиотек языка Python.
Требования
Нет
Образование
- Высшее образование
- Среднее профессиональное образование
Квалификация
Предварительное освоение иных дисциплин/курсов /модулей
Модули
свернутьПреподаватели

Савинова
Виктория Михайловна
Федеральное государственное бюджетное образовательное учреждение высшего образования "Российский экономический университет имени Г.В. Плеханова"
старший преподаватель кафедры информатики
https://www.rea.ru/ru/org/employees/Pages/Savinova-Viktorija-Mikhajjlovna.aspx
Дьяконова
Людмила Павловна
Федеральное государственное бюджетное образовательное учреждение высшего образования "Российский экономический университет имени Г.В. Плеханова"
доцент кафедры информатики
Кандидат физико-математических наук
доцент
https://www.rea.ru/ru/org/employees/Pages/Djakonova-Ljudmila-Pavlovna.aspxПрофстандарт
Специалист по большим данным
06.042Ответственный за программу
+79261922677