III уровень Большие данные

Основы Data Science на языке Python

Федеральное государственное бюджетное образовательное учреждение высшего образования "Российский экономический университет имени Г.В. Плеханова"
290,00 часов длительность
Онлайн формат
Базовый уровень
1 поток (закрыт) 20.06-07.10.2022
2 поток (закрыт) 08.08-07.11.2022
3 поток (закрыт) 19.09-20.12.2022
4 поток (закрыт) 28.11.2022-31.03.2023
5 поток (закрыт) 23.12.2022-28.04.2023
6 поток (закрыт) 29.12.2022-28.04.2023

Описание

Программа рассчитана на людей без опыта программирования и анализа данных и начинается с самых основ: изучения базового синтаксиса языка Python и введения в теорию вероятностей и статистический анализ данных. Далее вы изучите методы машинного и глубинного обучения, а также основные способы работы с большими данными. Все теоретические материалы закрепляются практическими кейсами.

Программа рассчитана на полгода и включает в себя 178 аудиторных академических часов занятий с преподавателем и 104 часа самостоятельной работы.

По итогам освоения программы вы:

- получите актуальные знания в одной из самых востребованных областей 21 века;

- сможете претендовать на позицию Junior Data Scientist;

- автоматизируете процессы сбора и анализа данных на вашей текущей позиции;

- станете более востребованным специалистом.

Данная образовательная программа посвящена анализу данных и машинному обучению для решения самых разнообразных бизнес-задач. Рассматриваются задачи бинарной и многоклассовой классификации, кластеризации и регрессии. Изучаются все популярные методы машинного обучения: линейные и нелинейные регрессии, логит и пробит модели, метод опорных векторов, решающие деревья, случайный лес, градиентный бустинг, нейронные сети и т.д. На занятиях рассматривается решение практических кейсов из самых разных областей (от кредитного скоринга до распознования образов), что позволяет слушателям отточить аналитические навыки на реальных данных.

#Data Science

#Python

#программирование

#анализ данных

#аналитика

Курс подойдет для людей без опыта программирования и анализа данных, желающих освоить программирования, статистической обработки данных и машинного обучения для решения самых разнообразных задач в маркетинге, кредитной аналитике, страховании, HR-аналитике, промышленной статистике, области распознования образов и речи, риск-аналитике и многих других сферах.

В результате обучения слушатель научится выполнять математические вычисления и строить модели машинного обучения на языке Python. 

В процессе освоения образовательной программы слушатели осваивают навыки программирования в среде Python, а также статистический инструментарий для анализа Больших данных. Формируются компетенции по back-end по разработке автоматизированных информационных систем для решения прикладных задач по аналитике данных в различных областях бизнеса.

Для успешного освоения данной программы выпускник программы «Основы Data Science на языке Python» должен:

Знать:

  • базовые математические методы и компьютерные технологии для сбора, обработки и анализа информации;

Уметь:

  • использовать современные компьютерные технологии для поиска информации в сети Интернет для решения поставленной задачи, критического анализа этой информации и обоснования принятых идей и подходов к решению;

Владеть:

  • основными методами, способами и средствами получения, хранения, переработки информации;
  • способностью анализировать социально значимые проблемы и процессы;
  • навыками работы с персональным компьютером на пользовательском уровне;
  • навыками работы с компьютером как средством управления информацией, способностью работать с информацией в глобальных компьютерных сетях.

Полученные знания и навыки слушатели смогут применять в маркетинге, кредитной аналитике, страховании HR-аналитике, промышленной статистике, области распознавания образов и речи, риск-аналитике и многих других сферах.

Данная образовательная программа позволяет слушателям решать практические задачи в самых разнообразных предметных областях, заниматься back-end разработкой модулей, позволяющих в автоматическом режиме проводить выгрузку, моделирование, вывод и интерпретацию результатов, которые могут быть использованы в качестве рекомендательных систем.

К освоению программы допускаются лица, имеющие высшее или среднее профессиональное, образование, владеющие основами экономических и математических дисциплин (в объёме базовой части, читаемой всем специальностям в вузах) и являющиеся уверенными пользователями персонального компьютера.

Часов в программе
50,00 часов
лекции
128,00 часов
практика
78,00 часов
самостоятельная
8,00 часов
промежуточная аттестация
2 часа
входная диагностика
24 часа
итоговая аттестация
290,00 часов
всего
Цель программы
Получение слушателями теоретических знаний, практических умений и навыков для проведения моделирования с использованием инструментов языка программирования Python c целью решения прикладных задач экономики
Актуальность
В настоящее время возрастает огромный спрос и потребность в грамотных сотрудниках и специалистах в области построения моделей для принятия эффективных управленческих решений, что является одной из наиболее значимых и важных проблем в стратегическом управлении любым предприятием. В условиях цифровой трансформации бизнеса и переходу стратегий, основанных на данных, необходимо повышать уровень грамотности представителей бизнеса в области инструментария работы с данными, а также принципов моделирования.
Входная диагностика 2 часа
Тестирование
Итоговая аттестация 24 часа
Защита отчетов по проекту по анализу данных.

Компетенции

Профессиональные


Навык использования основных типов данных, операторов и переменных языка Python
Знать:

Основные операторы языка Python.
Основные типы данных языка программирования Python (в том числе понимание динамической типизации).
Синтаксис создания переменных в языке Python.
Принцип работы встроенной функции вывода в консоль.
Синтаксис создания комментариев.

Уметь:

Выполнять простые математические вычисления на языке Python.
Выводить в консоль данные.
Создавать переменные и присваивать им значения различных типов данных.
Использовать среды разработки Spyder и Google colab для разработки на языке Python.

Владеть:

Навыками создания переменных различных типов.
Навыками вывода данных в консоль.
Навыками применения операторов языка Python для выполнения вычислений.

Навыки создания условных операторов if/else/elif
Знать:

Синтаксис создания условного потока с использованием выражения if/else.
Понятие логических переменных при создании условных потоков.
Принципы использования логических операторов при составлении условий.
Принципы использования выражений try и except при проверке ошибок.

Уметь:

Создавать контролируемые потоки кода с использованием конструкций if/else.
Применять условные переменные при создании контролируемых потоков.
Использовать логические операторы при составлении сложных условий.
Проверять возможные ошибки при выполнении кода с использованием конструкции try и except.

Владеть:

Навыками создания условных потоков с использованием конструкций if/else.
Навыками создания условий с использованием условных операторов.
Навыками создания условных потоков с использованием конструкций try и except.

Навык работы с текстовыми данными в языке Python
Знать:

Понятия и способы задания строк в Python.
Функции работы со строками, встроенные в языке Python.
Принципы индексации строк и способы создания срезов строк.
Принцип иммутабельности строк.
Основные escape последовательности и синтаксис их применения в языке Python.

Уметь:

Создавать строки на языке Python.
Применять встроенные функции работы со строками в языке Python.
Создавать срезы строк с использованием значений индексов строки.
Применять escape последовательности и синтаксис их применения в языке Python.

Владеть:

Навыками создания строк языке Python.
Навыками применения встроенных функций работы со строками языке Python.
Навыками создания срезов строк.
Навыками применения escape последовательности в языке Python.

Навык создания циклов в языке Python
Знать:

Синтаксис и принципы применения итерационных циклов с использованием конструкции for в языке Python.
Синтаксис и принципы применения циклов с выполнением условия с использованием конструкции while.

Уметь:

Создавать итерационные циклы с использованием конструкции for в языке Python.
Создавать итерационные циклы с выполнением условия с использованием конструкции while в языке Python.

Владеть:

Навыками применения цикла for для решения задач в языке Python.
Навыками применения цикла while для решения задач в языке Python.

Навык работы со словарями, списками, множествами и кортежами в среде Python
Знать:

Способы создания списков в языке Python.
Синтаксис создания словарей в Python.
Функции работы со списком в языке Python.
Отличия списка от кортежа в языке Python.

Уметь:

Создавать списки в языке Python.
Использовать встроенные функции для работы со словарями в языке Python.
Осуществлять работу со списками с использованием встроенных функций в языке Python.

Владеть:

Навыками работы со списками в языке Python.
Навыками использования встроенных функций для работы со словарями в языке Python.
Навыком применения встроенных функций работы со списками в языке Python.

Навык создания пользовательских функций и классов в языке Python
Знать:

Основное назначение функций в языках программирования.
Синтаксис и принципы создания функций в языке Python.

Уметь:

Разделять исходную функциональность на функции.
Задавать функции с использованием синтаксиса языка Python.

Владеть:

Навыками структурирования кода с использованием функций.
Навыками создания функций в языке Python.

Навыки работы с файлами в среде Python
Знать:

Основные форматы файлов данных, используемых в языке
Синтаксис работы с файлами в языке Python

Уметь:

Работать с файлами формата csv и json в языке Python

Владеть:

Навыками использования встроенных функций Python для работы с файлами

Навык построения линейной регрессии в среде Python
Знать:

Основные инструменты библиотеки Scikit-learn для построения линейной регрессии.
Основные способы оценки построенных моделей.

Уметь:

Использовать библиотеку Scikit-learn для построения линейной регрессии.

Владеть:

Навыками работы с библиотеками Scikit-learn для построения линейной регрессии.

Навык построения логистической регрессии и SVM в среде Python
Знать:

Основные инструменты библиотеки Scikit-learn для построения логистической регрессии и SVM.
Основные способы оценки построенных моделей.

Уметь:

Использовать библиотеку Scikit-learn для построения логистической регрессии и SVM.

Владеть:

Навыками работы с библиотеками Scikit-learn для построения логистической регрессии и SVM.

Навык построения моделей многоклассовой классификации в среде Python
Знать:

Основные инструменты библиотеки Scikit-learn для построения моделей многоклассовой классификации.
Основные способы работы с текстовыми признаками.

Уметь:

Использовать библиотеку Scikit-learn для построения моделей многоклассовой классификации.

Владеть:

Навыками работы с библиотеками Scikit-learn для построения моделей многоклассовой классификации.

Навык построения решающих деревьев, моделей случайного леса и градиентного бустинга
Знать:

Основные инструменты библиотеки Scikit-learn для построения решающих деревьев, моделей случайного леса и градиентного бустинга.
Основные способы оценки построенных моделей.

Уметь:

Использовать библиотеку Scikit-learn для построения решающих деревьев, моделей случайного леса и градиентного бустинга.

Владеть:

Навыками работы с библиотеками Scikit-learn для построения решающих деревьев, моделей случайного леса и градиентного бустинга.

Навык проведения кластеризации в среде Python
Знать:

Основные инструменты библиотеки Scikit-learn для построения дендрограмм, метода k-средних и EM-алгоритма.
Основные способы оценки качества кластеризации.

Уметь:

Использовать библиотеку Scikit-learn для построения дендрограмм, метода k-средних и EM-алгоритма.

Владеть:

Навыками работы с библиотеками Scikit-learn для построения дендрограмм, метода k-средних и EM-алгоритма.

Умение осуществлять построение моделей машинного обучения с использованием библиотеки Sickit-learn и TensorFlow
Знать:

Основные инструменты библиотеки Scikit-learn для осуществления построения моделей машинного обучения.

Уметь:

Использовать библиотеку Scikit-learn для построения моделей машинного обучения.

Владеть:

Навыками работы с библиотеками Scikit-learn для решения задач анализа данных.

ПК 1. Способность выявлять, формировать и согласовывать требования к результатам аналитических работ с применением технологий больших данных
Знать:

• методы машинного обучения
• стратегии создания рекомендательных систем
• методы сбора и обработки данных в сети Интернет
• типовые методы анализа данных;
• основные алгоритмы анализа данных

Уметь:

• проводить математический анализ больших данных • создавать, настраивать, сопровождать и анализировать работу рекомендательных систем; • работать с открытыми данными

Владеть:

• утилитами и библиотеками
• потоковой обработкой данных
• реляционной системой управления базами данных MySQL

ПК 3. Способность проводить аналитические исследования с применением технологий больших данных в соответствии с требованиями заказчика
Знать:

• стратегии создания рекомендательных систем
• методы сбора и обработки данных в сети Интернет
• типовые методы анализа данных
• основные алгоритмы анализа данных
• основы реляционных баз данных

Уметь:

• проводить математический анализ больших данных
• создавать модели машинного обучения для анализа данных
• проводить интеграцию обученных моделей в ИС организации
• создавать, настраивать, сопровождать и анализировать работу рекомендательных систем
• работать с открытыми данными
• осуществлять аналитику маркетинговой активности
• устанавливать и настраивать основные системы аналитики

Владеть:

• библиотеками Python: Numpy, Matplotlib, Scikit-learn

ПК 5. Способность управлять получением, хранением, передачей и обработкой больших данных
Знать:

• методы сбора и обработки данных в сети Интернет
• типовые методы анализа данных
• основные алгоритмы анализа данных

Уметь:

• создавать модели машинного обучения для анализа данных
• проводить интеграцию обученных моделей в ИС организации
• создавать, настраивать, сопровождать и анализировать работу рекомендательных систем
• работать с открытыми данными
• осуществлять аналитику маркетинговой активности
• устанавливать и настраивать основные системы аналитики

Владеть:

• статистическими методами анализа больших данных
• методами препроцессинга данных

ПК 6. Способность осуществлять кодирование на языках Python для работы с большими данными
Знать:

• основы языка программирования Python; • алгоритмы и структуры данных на Python; • основы высшей математики; • теорию вероятностей; • методы математической статистики

Уметь:

• работать с библиотеками Python: Numpy, Matplotlib, Scikit-learn; • осуществлять кодирование ИС на языке Python
• проводить математический анализ больших данных; • создавать модели машинного обучения для анализа данных

Владеть:

• методами машинного обучения
• методами математической статистики

Требования

Нет

Образование
  • Высшее образование
  • Среднее профессиональное образование
Квалификация
Бакалавр и выше

Модули

свернуть
94,00ч
Модуль 1 Основы Data science на языке Python
Данная образовательная программа посвящена анализу данных и машинному обучению для решения самых разнообразных бизнес-задач. Полученные знания и навыки вы с успехом можете применить в маркетинге, кредитной аналитике, страховании, HR-аналитике, промышленной статистике, области распознавания образов и речи, риск-аналитике и многих других сферах. Программа рассчитана на людей без опыта программирования и анализа данных и начинается с самых основ: изучения базового синтаксиса языка Python и введения в теорию вероятностей и статистический анализ данных. Далее вы изучите методы машинного и глубинного обучения, а также основные способы работы с большими данными. Все теоретические материалы закрепляются практическими кейсами.
170,00ч
Модуль 2 Python для машинного обучения
В данном модуле изучаются основные подходы, методы и модели Data mining, а также практические навыки применения встроенных средств языка Python 3, библиотеки визуализации данных Matplotlib и Seaborn, библиотеки работы с данными Pandas и NumPy, Библиотеки машинного обучения Scikit-learn, TensorFlow
94,00ч
Модуль 1 Основы Data science на языке Python
Данная образовательная программа посвящена анализу данных и машинному обучению для решения самых разнообразных бизнес-задач. Полученные знания и навыки вы с успехом можете применить в маркетинге, кредитной аналитике, страховании, HR-аналитике, промышленной статистике, области распознавания образов и речи, риск-аналитике и многих других сферах. Программа рассчитана на людей без опыта программирования и анализа данных и начинается с самых основ: изучения базового синтаксиса языка Python и введения в теорию вероятностей и статистический анализ данных. Далее вы изучите методы машинного и глубинного обучения, а также основные способы работы с большими данными. Все теоретические материалы закрепляются практическими кейсами.
170,00ч
Модуль 2 Python для машинного обучения
В данном модуле изучаются основные подходы, методы и модели Data mining, а также практические навыки применения встроенных средств языка Python 3, библиотеки визуализации данных Matplotlib и Seaborn, библиотеки работы с данными Pandas и NumPy, Библиотеки машинного обучения Scikit-learn, TensorFlow

Преподаватели

Моисеев

Никита Александрович

Федеральное государственное бюджетное образовательное учреждение высшего образования "Российский экономический университет имени Г.В. Плеханова"

Профессор кафедры математических методов в экономике

Ph.D. in economics

https://www.rea.ru/ru/org/employees/Pages/Moiseev-Nikita-Aleksandrovich.aspx?ysclid=l5b2jf9pfz959429570
110 000 p
Авторизуйтесь чтобы записаться

Профстандарт

Специалист по большим данным

06.042

Ответственный за программу

Moiseev.na@rea.ru

+7(926)9145350