Искусственный интеллект PyTorch Обрабатывать данные Pandas Анализировать данные Решать задачи машинного обучения Создавать, разрабатывать продукт NumPy Python Писать программный код Matplotlib Устанавливать, настраивать программное обеспечение TensorFlow Seaborn

Data Scientist

АНО ДПО "Корпоративный университет Сбербанка"
301 час длительность
Онлайн формат
Начальный уровень
1 поток (закрыт) 04.10.2021-07.02.2022
2 поток (закрыт) 01.11.2021-07.03.2022
3 поток (закрыт) 29.11.2021-04.04.2022

Описание

Data Science (наука о данных) – молодая отрасль на стыке интернет-технологий и бизнеса.

Задача исследователя данных (Data Scientist): строить математические модели, которые позволяют выявлять скрытые взаимосвязи в огромных массивах информации. Исследователь данных формирует на основе закономерностей в данных новые ценности, такие как предсказание будущего поведения в зависимости от начальных условий, рекомендации в зависимости от выявленных предпочтений и т.д. Помогает создавать продукты и повышать эффективность бизнес-решений, социальных взаимодействий, научных исследований и производственных процессов на основе выявленных математических моделей.

На текущий момент только в одной России больше 5000 компаний находятся в поисках специалистов по Data Science! Средняя зарплата в этой профессии составляет ~100 000 рублей и практически не имеет верхних границ.

Программа подойдет:

  • желающим начать свой путь в ИТ: мы дадим нужные знания и умения в программировании, математике, машинном и глубоком обучении, чтобы вы смогли сделать первые шаги навстречу карьере мечты;
  • аналитикам: вы сможете углубить свои знания, применить машинное обучение на практике и ускорить свое карьерное развитие;
  • начинающим программистам: вы откроете для себя удивительный мир анализа данных, расширите круг решаемых задач и возможности для карьерного роста. Специалисты в DS, обладающие опытом разработки ПО ценятся особенно сильно!

На программе вы научитесь:

  • программировать на Python – одном из самых популярных языков программирования в мире;
  • решать математические задачи, необходимые для работы с алгоритмами машинного обучения и нейронными сетями;
  • проводить первичный анализ данных с помощью SQL и библиотек Python: Pandas, Numpy, Seaborn, Matplotlib, etc
  • выдвигать и проверять статистические гипотезы;
  • применять алгоритмы машинного обучения для решения прикладных задач;
  • обучать и применять в реальных задачах нейронные сети.

Кроме этого, мы поможем вам грамотно составить резюме и выстроить поиск первой работы в Data Science!

Обучение состоит из двух частей:

  • "бассейн", одномесячный онлайн-интенсив из электронных курсов, на котором вы осваиваете базовые навыки программирования с поддержкой от специалистов СберУниверситета;
  • трехмесячное обучение в формате вебинаров под руководством высококлассных преподавателей-практиков, интересными ДЗ, персонализированной обратной связью, реальными командными и личными проектами!

Вебинары проходят 2 раза в неделю вечером в нерабочее время, поэтому обучение легко совмещать с работой. Мы не набираем больших групп, чтобы каждый слушатель мог получить ответы свои вопросы во время занятий, личную обратную связь по домашним заданиям и проектам!

У кого вы будете учиться?

Команда преподавателей, методистов и кураторов с опытом организации обучения Data Science и Data Engineering более 3 лет. Команда сочетает в себе 3 ключевые экспертизы:

  • индустриальная: практики data engineers и ml/dl engineers из крупнейших российских и международных ИТ-компаний;
  • академическая: преподаватели и выпускники лучших ВУЗов России: ВШЭ, МФТИ, МГУ, Школа Анализа Данных Яндекса, etc;
  • образовательная: через каждого преподавателя в нашей команде прошли сотни слушателей из российских компаний или вузов.

Во время обучения вы реализуете 3 проекта лично или в команде:

  • первичный анализ данных – найдете инсайты в реальном медицинском датасете;
  • предобработка данных и обучение ML-моделей для анализа стоимости недвижимости;
  • выпускной проект, тема которого согласуется с преподавателем во время обучения.

Примеры тем выпускных проектов с прошлых потоков (обучение прошли уже сотни слушателей):

  • Style Transfer. Разобраться в классическом алгоритме переноса стиля (именно разобраться, я проверю), реализовать его на PyTorch. Бонус -- реализовать любой из алгоритмов нейросетевого переноса стиля.
  • FaceSwap. Разобраться в нейросетевых архитектурах сегментации изображений и выделения ключевых точек лица. Написать алгоритм, который правдоподобно меняет два наперёд заданных лица местами.
  • Face ID. Разобраться в алгоритмах распознавания лиц на фото. Реализовать простейший алгоритм на основе эмбеддингов фотографий (скажем, через SVD-разложение) или какую-то нейросетевую архитектуру на PyTorch. Добиться того, чтобы алгоритм отличал ваше лицо от чужих (скажем, от моего).
  • Смена сезонов на фото. Реализовать архитектуру CycleGAN на Pytorch, обучить её на датасетах с изображениями зимних и летних пейзажей, научиться менять сезон на фото. Россия -- страна затяжной зимы. Давайте бороться с этим!
Часов в программе
95 часов
лекции
103 часа
практика
64 часа
самостоятельная
34 часа
промежуточная аттестация
1 час
входная диагностика
4 часа
итоговая аттестация
301 час
всего
Цель программы
Получить компетенции, связанные с работой с данными в SQL, программированием на языке Python, математикой для анализа данных, машинном и глубоким обучении, необходимых для старта карьеры в сфере Data Science.
Актуальность
На текущий момент только в одной России больше 5 000 компаний находятся в поисках специалистов по Data Science! Средняя зарплата в этой профессии составляет ~ 100 000 рублей и практически не имеет верхних границ. Сегодня данные – основа успеха всех крупных преуспевающих компаний, которые видят себя лидерами будущего. Данные необходимо собирать, обрабатывать и строить на их основе модели, которые приносят пользу всему человечеству и бизнесу – для этого необходимы специалисты в сфере Data Science!
Входная диагностика 1 час
Зачет
Итоговая аттестация 4 часа
Итоговая аттестационная работа

Компетенции

Профессиональные


Работа с данными в SQL
Знать:

базовый синтаксис SQL, методологии и технологии проектирования и использования баз данных, особенности системы управления базами данных SQLite

Уметь:

извлекать данные из БД и манипулировать ими с помощью SQL

Владеть:

навыком извлечения и обработки данных с помощью SQL, навыком работы в SQL Developer

Программирование на языке Python
Знать:

тип языка, типы и структуры данных, понятие переменной, циклы, условные конструкции, функции, принципы работы алгоритмов, библиотеки Python: seaborn, matplotlib, numpy, pandas

Уметь:

решать базовые алгоритмические задачи, загружать и обрабатывать данные (csv, xlsx, txt, json, jpg, etc) с помощью Python и его библиотек, установить Python и библиотеки на ПК, работать в google colab research

Владеть:

навыком написания программ на Python, используя его основные синтаксические конструкции, навыком работы в Google Research Colab

Математика для анализа данных
Знать:

основные концепции логики и комбинаторики, математического анализа, линейной алгебры, теории вероятностей, статистики, теории оптимизации

Уметь:

решать базовые задачи из логики и комбинаторики, математического анализа, линейной алгебры, теории вероятностей, статистики, теории оптимизации; уметь описывать алгоритмы на формальном математическом языке.

Владеть:

навыком решения базовых математических задач, навыком математического описания алгоритмов

Машинное обучение
Знать:

основы математического моделирования, основные концепции машинного обучения, виды задач в машинном обучении, способы оценки качества моделей машинного обучения, алгоритм линейной регрессии, алгоритм логистической регрессии, деревья решений, ансамбли алгоритмов, boosting, методы регуляризации, базовые методы обработки табличных данных, текстов, изображений и временных рядов, методы работы с признаками, базовые алгоритмы кластеризации, метрические алгоритмы; библиотеки Python для машинного обучения

Уметь:

решать задачи классификации, регрессии, кластеризации с помощью методов машинного обучения, используя Python и его библиотеки

Владеть:

навыком в Python и его библиотеках для решения задач машинного и глубокого обучения, навыком работы в Google Recearch Colab

Глубокое обучение
Знать:

основные задачи, решаемые нейронными сетями; метод обратного распространения ошибки (backpropagation), перцептрон, полносвязные нейронные сети, сверточные нейронные сети, рекуррентные нейронные сети, современные архитектуры нейронных задач для решения задач компьютерного зрения (CV) и обработки текстов (NLP), фреймворки Pytorch, TensorFlow

Уметь:

решать задачи классификации, регрессии, кластеризации, обработки изображений и текстов с помощью методов глубокого обучения, Python, его библиотеки и фреймворка Pytorch

Владеть:

навыком в Python и его библиотеках, фреймворке Pytorch для решения задач машинного и глубокого обучения, навыком работы в Google Recearch Colab

Требования

Нет

Образование
  • Высшее образование
  • Среднее профессиональное образование

Модули

свернуть
152ч
Модуль 1 Базовый модуль
Онлайн-интенсив из электронных курсов, на котором слушатели с поддержкой от специалистов СберУниверситета получают базовые умения программирования на Python и работы с данными в SQL, узнают основы математики для анализа данных и базовые концепции машинного обучения.
144ч
Модуль 2 Профильный модуль
Обучение в формате вебинаров под руководством высококлассных преподавателей-практиков, интересными ДЗ, персонализированной обратной связью, реальными командными и личными проектами! Слушатели осваивают первичный анализ данных с помощью библиотек Python, погружаются в математические задачи, необходимые для глубокого понимания методов анализа данных, после чего переходят к методам машинного обучения и нейронным сетям на практике!
152ч
Модуль 1 Базовый модуль
Онлайн-интенсив из электронных курсов, на котором слушатели с поддержкой от специалистов СберУниверситета получают базовые умения программирования на Python и работы с данными в SQL, узнают основы математики для анализа данных и базовые концепции машинного обучения.
144ч
Модуль 2 Профильный модуль
Обучение в формате вебинаров под руководством высококлассных преподавателей-практиков, интересными ДЗ, персонализированной обратной связью, реальными командными и личными проектами! Слушатели осваивают первичный анализ данных с помощью библиотек Python, погружаются в математические задачи, необходимые для глубокого понимания методов анализа данных, после чего переходят к методам машинного обучения и нейронным сетям на практике!

Преподаватели

Мороз

Юлия

АНО ДПО "Корпоративный университет Сбербанка"

Руководитель направления

кандидат наук

доцент

Клименко

Дарья

АНО ДПО "Корпоративный университет Сбербанка"

Ведущий специалист

90 000 p

Указана полная стоимость. Вы сможете получить скидку на этот курс от 50% до 100% по проекту «Цифровые профессии» в зависимости от льготной категории.

Авторизуйтесь чтобы записаться

Профстандарт

Специалист по большим данным

06.042

Ответственный за программу