Основы Data Science на языке Python
Федеральное государственное бюджетное образовательное учреждение высшего образования "Российский экономический университет имени Г.В. Плеханова"
Описание
Программа рассчитана на людей без опыта программирования и анализа данных и начинается с самых основ: изучения базового синтаксиса языка Python и введения в теорию вероятностей и статистический анализ данных. Далее вы изучите методы машинного и глубинного обучения, а также основные способы работы с большими данными. Все теоретические материалы закрепляются практическими кейсами.
Программа рассчитана на полгода и включает в себя 178 аудиторных академических часов занятий с преподавателем и 104 часа самостоятельной работы.
По итогам освоения программы вы:
- получите актуальные знания в одной из самых востребованных областей 21 века;
- сможете претендовать на позицию Junior Data Scientist;
- автоматизируете процессы сбора и анализа данных на вашей текущей позиции;
- станете более востребованным специалистом.
Данная образовательная программа посвящена анализу данных и машинному обучению для решения самых разнообразных бизнес-задач. Рассматриваются задачи бинарной и многоклассовой классификации, кластеризации и регрессии. Изучаются все популярные методы машинного обучения: линейные и нелинейные регрессии, логит и пробит модели, метод опорных векторов, решающие деревья, случайный лес, градиентный бустинг, нейронные сети и т.д. На занятиях рассматривается решение практических кейсов из самых разных областей (от кредитного скоринга до распознования образов), что позволяет слушателям отточить аналитические навыки на реальных данных.
#Data Science
#Python
#программирование
#анализ данных
#аналитика
Курс подойдет для людей без опыта программирования и анализа данных, желающих освоить программирования, статистической обработки данных и машинного обучения для решения самых разнообразных задач в маркетинге, кредитной аналитике, страховании, HR-аналитике, промышленной статистике, области распознования образов и речи, риск-аналитике и многих других сферах.
В результате обучения слушатель научится выполнять математические вычисления и строить модели машинного обучения на языке Python.
В процессе освоения образовательной программы слушатели осваивают навыки программирования в среде Python, а также статистический инструментарий для анализа Больших данных. Формируются компетенции по back-end по разработке автоматизированных информационных систем для решения прикладных задач по аналитике данных в различных областях бизнеса.
Для успешного освоения данной программы выпускник программы «Основы Data Science на языке Python» должен:
Знать:
- базовые математические методы и компьютерные технологии для сбора, обработки и анализа информации;
Уметь:
- использовать современные компьютерные технологии для поиска информации в сети Интернет для решения поставленной задачи, критического анализа этой информации и обоснования принятых идей и подходов к решению;
Владеть:
- основными методами, способами и средствами получения, хранения, переработки информации;
- способностью анализировать социально значимые проблемы и процессы;
- навыками работы с персональным компьютером на пользовательском уровне;
- навыками работы с компьютером как средством управления информацией, способностью работать с информацией в глобальных компьютерных сетях.
Полученные знания и навыки слушатели смогут применять в маркетинге, кредитной аналитике, страховании HR-аналитике, промышленной статистике, области распознавания образов и речи, риск-аналитике и многих других сферах.
Данная образовательная программа позволяет слушателям решать практические задачи в самых разнообразных предметных областях, заниматься back-end разработкой модулей, позволяющих в автоматическом режиме проводить выгрузку, моделирование, вывод и интерпретацию результатов, которые могут быть использованы в качестве рекомендательных систем.
К освоению программы допускаются лица, имеющие высшее или среднее профессиональное, образование, владеющие основами экономических и математических дисциплин (в объёме базовой части, читаемой всем специальностям в вузах) и являющиеся уверенными пользователями персонального компьютера.
Часов в программе
Цель программы
Актуальность
Входная диагностика 2 часа
Итоговая аттестация 24 часа
Компетенции
Профессиональные
Навык использования основных типов данных, операторов и переменных языка Python
Основные операторы языка Python.
Основные типы данных языка программирования Python (в том числе понимание динамической типизации).
Синтаксис создания переменных в языке Python.
Принцип работы встроенной функции вывода в консоль.
Синтаксис создания комментариев.
Выполнять простые математические вычисления на языке Python.
Выводить в консоль данные.
Создавать переменные и присваивать им значения различных типов данных.
Использовать среды разработки Spyder и Google colab для разработки на языке Python.
Навыками создания переменных различных типов.
Навыками вывода данных в консоль.
Навыками применения операторов языка Python для выполнения вычислений.
Навыки создания условных операторов if/else/elif
Синтаксис создания условного потока с использованием выражения if/else.
Понятие логических переменных при создании условных потоков.
Принципы использования логических операторов при составлении условий.
Принципы использования выражений try и except при проверке ошибок.
Создавать контролируемые потоки кода с использованием конструкций if/else.
Применять условные переменные при создании контролируемых потоков.
Использовать логические операторы при составлении сложных условий.
Проверять возможные ошибки при выполнении кода с использованием конструкции try и except.
Навыками создания условных потоков с использованием конструкций if/else.
Навыками создания условий с использованием условных операторов.
Навыками создания условных потоков с использованием конструкций try и except.
Навык работы с текстовыми данными в языке Python
Понятия и способы задания строк в Python.
Функции работы со строками, встроенные в языке Python.
Принципы индексации строк и способы создания срезов строк.
Принцип иммутабельности строк.
Основные escape последовательности и синтаксис их применения в языке Python.
Создавать строки на языке Python.
Применять встроенные функции работы со строками в языке Python.
Создавать срезы строк с использованием значений индексов строки.
Применять escape последовательности и синтаксис их применения в языке Python.
Навыками создания строк языке Python.
Навыками применения встроенных функций работы со строками языке Python.
Навыками создания срезов строк.
Навыками применения escape последовательности в языке Python.
Навык создания циклов в языке Python
Синтаксис и принципы применения итерационных циклов с использованием конструкции for в языке Python.
Синтаксис и принципы применения циклов с выполнением условия с использованием конструкции while.
Создавать итерационные циклы с использованием конструкции for в языке Python.
Создавать итерационные циклы с выполнением условия с использованием конструкции while в языке Python.
Навыками применения цикла for для решения задач в языке Python.
Навыками применения цикла while для решения задач в языке Python.
Навык работы со словарями, списками, множествами и кортежами в среде Python
Способы создания списков в языке Python.
Синтаксис создания словарей в Python.
Функции работы со списком в языке Python.
Отличия списка от кортежа в языке Python.
Создавать списки в языке Python.
Использовать встроенные функции для работы со словарями в языке Python.
Осуществлять работу со списками с использованием встроенных функций в языке Python.
Навыками работы со списками в языке Python.
Навыками использования встроенных функций для работы со словарями в языке Python.
Навыком применения встроенных функций работы со списками в языке Python.
Навык создания пользовательских функций и классов в языке Python
Основное назначение функций в языках программирования.
Синтаксис и принципы создания функций в языке Python.
Разделять исходную функциональность на функции.
Задавать функции с использованием синтаксиса языка Python.
Навыками структурирования кода с использованием функций.
Навыками создания функций в языке Python.
Навыки работы с файлами в среде Python
Основные форматы файлов данных, используемых в языке
Синтаксис работы с файлами в языке Python
Работать с файлами формата csv и json в языке Python
Владеть:Навыками использования встроенных функций Python для работы с файлами
Навык построения линейной регрессии в среде Python
Основные инструменты библиотеки Scikit-learn для построения линейной регрессии.
Основные способы оценки построенных моделей.
Использовать библиотеку Scikit-learn для построения линейной регрессии.
Владеть:Навыками работы с библиотеками Scikit-learn для построения линейной регрессии.
Навык построения логистической регрессии и SVM в среде Python
Основные инструменты библиотеки Scikit-learn для построения логистической регрессии и SVM.
Основные способы оценки построенных моделей.
Использовать библиотеку Scikit-learn для построения логистической регрессии и SVM.
Владеть:Навыками работы с библиотеками Scikit-learn для построения логистической регрессии и SVM.
Навык построения моделей многоклассовой классификации в среде Python
Основные инструменты библиотеки Scikit-learn для построения моделей многоклассовой классификации.
Основные способы работы с текстовыми признаками.
Использовать библиотеку Scikit-learn для построения моделей многоклассовой классификации.
Владеть:Навыками работы с библиотеками Scikit-learn для построения моделей многоклассовой классификации.
Навык построения решающих деревьев, моделей случайного леса и градиентного бустинга
Основные инструменты библиотеки Scikit-learn для построения решающих деревьев, моделей случайного леса и градиентного бустинга.
Основные способы оценки построенных моделей.
Использовать библиотеку Scikit-learn для построения решающих деревьев, моделей случайного леса и градиентного бустинга.
Владеть:Навыками работы с библиотеками Scikit-learn для построения решающих деревьев, моделей случайного леса и градиентного бустинга.
Навык проведения кластеризации в среде Python
Основные инструменты библиотеки Scikit-learn для построения дендрограмм, метода k-средних и EM-алгоритма.
Основные способы оценки качества кластеризации.
Использовать библиотеку Scikit-learn для построения дендрограмм, метода k-средних и EM-алгоритма.
Владеть:Навыками работы с библиотеками Scikit-learn для построения дендрограмм, метода k-средних и EM-алгоритма.
Умение осуществлять построение моделей машинного обучения с использованием библиотеки Sickit-learn и TensorFlow
Основные инструменты библиотеки Scikit-learn для осуществления построения моделей машинного обучения.
Уметь:Использовать библиотеку Scikit-learn для построения моделей машинного обучения.
Владеть:Навыками работы с библиотеками Scikit-learn для решения задач анализа данных.
ПК 1. Способность выявлять, формировать и согласовывать требования к результатам аналитических работ с применением технологий больших данных
• методы машинного обучения
• стратегии создания рекомендательных систем
• методы сбора и обработки данных в сети Интернет
• типовые методы анализа данных;
• основные алгоритмы анализа данных
• проводить математический анализ больших данных • создавать, настраивать, сопровождать и анализировать работу рекомендательных систем; • работать с открытыми данными
Владеть:• утилитами и библиотеками
• потоковой обработкой данных
• реляционной системой управления базами данных MySQL
ПК 3. Способность проводить аналитические исследования с применением технологий больших данных в соответствии с требованиями заказчика
• стратегии создания рекомендательных систем
• методы сбора и обработки данных в сети Интернет
• типовые методы анализа данных
• основные алгоритмы анализа данных
• основы реляционных баз данных
• проводить математический анализ больших данных
• создавать модели машинного обучения для анализа данных
• проводить интеграцию обученных моделей в ИС организации
• создавать, настраивать, сопровождать и анализировать работу рекомендательных систем
• работать с открытыми данными
• осуществлять аналитику маркетинговой активности
• устанавливать и настраивать основные системы аналитики
• библиотеками Python: Numpy, Matplotlib, Scikit-learn
ПК 5. Способность управлять получением, хранением, передачей и обработкой больших данных
• методы сбора и обработки данных в сети Интернет
• типовые методы анализа данных
• основные алгоритмы анализа данных
• создавать модели машинного обучения для анализа данных
• проводить интеграцию обученных моделей в ИС организации
• создавать, настраивать, сопровождать и анализировать работу рекомендательных систем
• работать с открытыми данными
• осуществлять аналитику маркетинговой активности
• устанавливать и настраивать основные системы аналитики
• статистическими методами анализа больших данных
• методами препроцессинга данных
ПК 6. Способность осуществлять кодирование на языках Python для работы с большими данными
• основы языка программирования Python; • алгоритмы и структуры данных на Python; • основы высшей математики; • теорию вероятностей; • методы математической статистики
Уметь:• работать с библиотеками Python: Numpy, Matplotlib, Scikit-learn; • осуществлять кодирование ИС на языке Python
• проводить математический анализ больших данных; • создавать модели машинного обучения для анализа данных
• методами машинного обучения
• методами математической статистики
Требования
Нет
Образование
- Высшее образование
- Среднее профессиональное образование
Квалификация
Модули
свернутьПреподаватели
Моисеев
Никита Александрович
Федеральное государственное бюджетное образовательное учреждение высшего образования "Российский экономический университет имени Г.В. Плеханова"
Профессор кафедры математических методов в экономике
Ph.D. in economics
https://www.rea.ru/ru/org/employees/Pages/Moiseev-Nikita-Aleksandrovich.aspx?ysclid=l5b2jf9pfz959429570Профстандарт
Специалист по большим данным
06.042Ответственный за программу
+7(926)9145350