III уровень Программирование и создание ИТ-продуктов

Python для анализа данных

АНО ДПО "СофтЛайн Эдюкейшн"
72 часа длительность
Онлайн формат
Базовый уровень

Описание

В соответствии с профессиональным стандартом «Специалист по большим данным», программа повышения квалификации «Python для анализа данных» направлена на формирование профессиональных компетенций в области анализа больших данных с использованием существующей в организации методологической и технологической инфраструктуры. Анализ данных применяется в самых разных областях - розничная торговля, банковское дело, страхование, телекоммуникации, техника, медицина, молекулярная биология, молекулярная генетика, хемоинформатика и так далее.
Для успешного освоения программы обучающимся необходимо владеть базовыми компетенциями цифровой грамотности, в том числе навыками владения ПК на уровне среднего или продвинутого пользователя; компетенции в области алгоритмизации, в том числе знаниями и умениями в области алгоритмизации (знание основных алгоритмических структур, умения выражать их на псевдокоде и в виде блок-схем) и программирования, базовыми знаниями в области языка Python, а также знаниями основ линейной алгебры, математического анализа и теории вероятностей.
В процессе обучения по программе обучающимся рекомендуется прослушать и конспектировать все видеолекции, выполнять по каждой теме практические задания с автоматизированной проверкой и проработать самостоятельно дополнительные материалы, после этого необходимо выполнить тесты по каждой теме и, для успешного завершения обучения, сдать итоговый тест (не менее 60% верных ответов).  
Обучающиеся в результате освоения программы будут знать синтаксис основных библиотек для анализа данных – NumPy, SciPy, Pandas, Sklearn и построения нейронных сетей – Keras, TensorFlow; синтаксис основных библиотек для визуализации данных – Matplotlib, Plotly;  особенности работы в среде Jupyter notebook и Colab; основные алгоритмы обучения на размеченных данных; основные алгоритмы обучения на неразмеченных данных; основные архитектуры нейросетей; будут владеть навыками создания программного кода на Python, который визуализирует данные; навыками создания программного кода на Python, который решает задачи регрессии и классификации; навыками создания кода, который решает задачу построения нейросети с использованием фреймворка Keras.
Результаты обучения по программе будут востребованы при решении таких профессиональных задач, как написание программного кода на языке Python для анализа или визуализации данных.

Цель программы
Программа повышения квалификации "Python для анализа данных" направлена на освоение (совершенствование) профессиональных компетенций в области "Анализ больших данных с использованием существующей в организации методологической и технологической инфраструктуры" по направлению развития цифровой экономики "Большие данные".
Программа повышения квалификации "Python для анализа данных" также формирует профессиональные компетенции для решения прикладных задач с помощью языка Python.

Требования

Категория слушателей: разработчики программного обеспечения, руководители служб и подразделений в сфере информационно-коммуникационных технологий, программисты приложе-ний
Уровень квалификации: не ниже 4 
Для успешного прохождения программы слушатели должны обладать:
• навыками владения ПК на уровне среднего или продвинутого пользователя;
• первичными знаниями и умениями в области алгоритмизации и программирования на языке Python.
• Знаниями в области теории вероятностей, математического анализа и линейной алгебры в объёме первого курса технического вуза.
Специальные требования к образованию не предъявляются.

Иные требования и рекомендации для обучения по программе

Категория слушателей: разработчики программного обеспечения, руководители служб и подразделений в сфере информационно-коммуникационных технологий, программисты приложе-ний
Уровень квалификации: не ниже 4 
Для успешного прохождения программы слушатели должны обладать:
• навыками владения ПК на уровне среднего или продвинутого пользователя;
• первичными знаниями и умениями в области алгоритмизации и программирования на языке Python.
• Знаниями в области теории вероятностей, математического анализа и линейной алгебры в объёме первого курса технического вуза.
Специальные требования к образованию не предъявляются.

Модули

свернуть
Модуль 1 Математика для анализа данных и библиотеки
Анализ данных, машинное обучение искусственный интеллект, является одним из самых горячих областей на сегодняшний день, а Питон является одним из самых популярных языков для того чтобы применять алгоритмы машинного обучения. С развитием интернета, появлением смартфонов и в целом с развитием технологий умных устройств мы с вами генерим все больше и больше данных каждый день. DataScience - это наука о том, как анализировать эти данные, находить в них природную зависимость, делать выводы на основе этих данных. Тяжело переоценить все возможности анализа данных. Для понимания методов анализа данных, необходимо знание в математическом анализе, линейной алгебре и математической статистике. Звучит страшно? Не переживайте, если вы не знакомы с этими областями знаний или прошло очень много времени с тех пор как вы последний раз виделись, дополнить и освежить знания математического анализа и линейной алгебры вы сможете в течение первого модуля нашего курса.
Модуль 3 Обучение с учителем
В этом модуле мы с вами поговорим про машинное обучение с учителем — самый распространенный подход к решению задач машинного обучения. Поговорим про линейную регрессию, про задачи регрессии и классификации, обсудим то, как обучаются модели машинного обучения, и как проверять их качество. И разберем ансамблевые подходы к построению алгоритмов машинного обучения. В конце у нас будет, как обычно, практическое задание.
Модуль 5 Нейронные сети
В последнем модуле мы изучим две большие темы: основы нейронных сетей и архитектуры нейронных сетей. В результате освоения этого модуля вы сможете реализовывать свою нейросеть
Модуль 2 Визуализация и статистический анализ данных
Во втором модуле вы познакомитесь с визуализацией и статистикой. Наш курс посвящен анализу данных, и он не ограничивается только алгоритмами машинного обучения. Немаловажную роль занимает теория вероятности и статистика. Понимание статистики поможет вам в дальнейшем подготовить данные для обучения, например, понять какое распределение имеет целевая переменная, избежать несбалансированности классов данных, найти зависимости между признаками и целевой переменной. Вы узнаете, или вспомните основные определения теории вероятностей и математической статистики, нужные для курса, и научитесь генерировать распределение в Saipay, находить доверительный интервал и проводить АВ-тестирование.
Модуль 4 Методы обучения без учителя
В этом модуле мы с вами изучим три большие темы. Первая тема - это алгоритм кластеризации. Мы изучим какие бывают алгоритмы кластеризации, как и их применять на данных, как оценивать кластеризацию. Более детально мы с вами изучим три метода. Это метод k-Means, иерархическая кластеризация и DBSCAN. Вторая большая тема - это методы уменьшения размерности. В ней мы с вами изучим метод главных компонент, многомерное шкалирование, и популярный в последнее время алгоритм, t-SNE. И последняя большая тема - это рекомендательные системы. В ней мы изучим подходы построения рекомендаций систем связанных с коллаборативной фильтрацией и матричным разложением.
Модуль 6 Итоговое тестирование
Итоговое тестирование
Модуль 1 Математика для анализа данных и библиотеки
Анализ данных, машинное обучение искусственный интеллект, является одним из самых горячих областей на сегодняшний день, а Питон является одним из самых популярных языков для того чтобы применять алгоритмы машинного обучения. С развитием интернета, появлением смартфонов и в целом с развитием технологий умных устройств мы с вами генерим все больше и больше данных каждый день. DataScience - это наука о том, как анализировать эти данные, находить в них природную зависимость, делать выводы на основе этих данных. Тяжело переоценить все возможности анализа данных. Для понимания методов анализа данных, необходимо знание в математическом анализе, линейной алгебре и математической статистике. Звучит страшно? Не переживайте, если вы не знакомы с этими областями знаний или прошло очень много времени с тех пор как вы последний раз виделись, дополнить и освежить знания математического анализа и линейной алгебры вы сможете в течение первого модуля нашего курса.
Модуль 2 Визуализация и статистический анализ данных
Во втором модуле вы познакомитесь с визуализацией и статистикой. Наш курс посвящен анализу данных, и он не ограничивается только алгоритмами машинного обучения. Немаловажную роль занимает теория вероятности и статистика. Понимание статистики поможет вам в дальнейшем подготовить данные для обучения, например, понять какое распределение имеет целевая переменная, избежать несбалансированности классов данных, найти зависимости между признаками и целевой переменной. Вы узнаете, или вспомните основные определения теории вероятностей и математической статистики, нужные для курса, и научитесь генерировать распределение в Saipay, находить доверительный интервал и проводить АВ-тестирование.
Модуль 3 Обучение с учителем
В этом модуле мы с вами поговорим про машинное обучение с учителем — самый распространенный подход к решению задач машинного обучения. Поговорим про линейную регрессию, про задачи регрессии и классификации, обсудим то, как обучаются модели машинного обучения, и как проверять их качество. И разберем ансамблевые подходы к построению алгоритмов машинного обучения. В конце у нас будет, как обычно, практическое задание.
Модуль 4 Методы обучения без учителя
В этом модуле мы с вами изучим три большие темы. Первая тема - это алгоритм кластеризации. Мы изучим какие бывают алгоритмы кластеризации, как и их применять на данных, как оценивать кластеризацию. Более детально мы с вами изучим три метода. Это метод k-Means, иерархическая кластеризация и DBSCAN. Вторая большая тема - это методы уменьшения размерности. В ней мы с вами изучим метод главных компонент, многомерное шкалирование, и популярный в последнее время алгоритм, t-SNE. И последняя большая тема - это рекомендательные системы. В ней мы изучим подходы построения рекомендаций систем связанных с коллаборативной фильтрацией и матричным разложением.
Модуль 5 Нейронные сети
В последнем модуле мы изучим две большие темы: основы нейронных сетей и архитектуры нейронных сетей. В результате освоения этого модуля вы сможете реализовывать свою нейросеть
Модуль 6 Итоговое тестирование
Итоговое тестирование

Преподаватели

Пестров

Никита Николаевич

АНО ДПО "СофтЛайн Эдюкейшн"

Жебрак

Александр Михайлович

АНО ДПО "СофтЛайн Эдюкейшн"

Шестаков

Андрей Владимирович

АНО ДПО "СофтЛайн Эдюкейшн"

Широкова

Елена Сергеевна

АНО ДПО "СофтЛайн Эдюкейшн"
Авторизуйтесь чтобы записаться

Ответственный за программу

edu2035@softline.com

+7(495)2320023