Data Scientist
АНО ДПО "Корпоративный университет Сбербанка"
Описание
Data Science (наука о данных) – молодая отрасль на стыке интернет-технологий и бизнеса.
Задача исследователя данных (Data Scientist): строить математические модели, которые позволяют выявлять скрытые взаимосвязи в огромных массивах информации. Исследователь данных формирует на основе закономерностей в данных новые ценности, такие как предсказание будущего поведения в зависимости от начальных условий, рекомендации в зависимости от выявленных предпочтений и т.д. Помогает создавать продукты и повышать эффективность бизнес-решений, социальных взаимодействий, научных исследований и производственных процессов на основе выявленных математических моделей.
На текущий момент только в одной России больше 5000 компаний находятся в поисках специалистов по Data Science! Средняя зарплата в этой профессии составляет ~100 000 рублей и практически не имеет верхних границ.
Программа подойдет:
- желающим начать свой путь в ИТ: мы дадим нужные знания и умения в программировании, математике, машинном и глубоком обучении, чтобы вы смогли сделать первые шаги навстречу карьере мечты;
- аналитикам: вы сможете углубить свои знания, применить машинное обучение на практике и ускорить свое карьерное развитие;
- начинающим программистам: вы откроете для себя удивительный мир анализа данных, расширите круг решаемых задач и возможности для карьерного роста. Специалисты в DS, обладающие опытом разработки ПО ценятся особенно сильно!
На программе вы научитесь:
- программировать на Python – одном из самых популярных языков программирования в мире;
- решать математические задачи, необходимые для работы с алгоритмами машинного обучения и нейронными сетями;
- проводить первичный анализ данных с помощью SQL и библиотек Python: Pandas, Numpy, Seaborn, Matplotlib, etc
- выдвигать и проверять статистические гипотезы;
- применять алгоритмы машинного обучения для решения прикладных задач;
- обучать и применять в реальных задачах нейронные сети.
Кроме этого, мы поможем вам грамотно составить резюме и выстроить поиск первой работы в Data Science!
Обучение состоит из двух частей:
- "бассейн", одномесячный онлайн-интенсив из электронных курсов, на котором вы осваиваете базовые навыки программирования с поддержкой от специалистов СберУниверситета;
- трехмесячное обучение в формате вебинаров под руководством высококлассных преподавателей-практиков, интересными ДЗ, персонализированной обратной связью, реальными командными и личными проектами!
Вебинары проходят 2 раза в неделю вечером в нерабочее время, поэтому обучение легко совмещать с работой. Мы не набираем больших групп, чтобы каждый слушатель мог получить ответы свои вопросы во время занятий, личную обратную связь по домашним заданиям и проектам!
У кого вы будете учиться?
Команда преподавателей, методистов и кураторов с опытом организации обучения Data Science и Data Engineering более 3 лет. Команда сочетает в себе 3 ключевые экспертизы:
- индустриальная: практики data engineers и ml/dl engineers из крупнейших российских и международных ИТ-компаний;
- академическая: преподаватели и выпускники лучших ВУЗов России: ВШЭ, МФТИ, МГУ, Школа Анализа Данных Яндекса, etc;
- образовательная: через каждого преподавателя в нашей команде прошли сотни слушателей из российских компаний или вузов.
Во время обучения вы реализуете 3 проекта лично или в команде:
- первичный анализ данных – найдете инсайты в реальном медицинском датасете;
- предобработка данных и обучение ML-моделей для анализа стоимости недвижимости;
- выпускной проект, тема которого согласуется с преподавателем во время обучения.
Примеры тем выпускных проектов с прошлых потоков (обучение прошли уже сотни слушателей):
- Style Transfer. Разобраться в классическом алгоритме переноса стиля (именно разобраться, я проверю), реализовать его на PyTorch. Бонус -- реализовать любой из алгоритмов нейросетевого переноса стиля.
- FaceSwap. Разобраться в нейросетевых архитектурах сегментации изображений и выделения ключевых точек лица. Написать алгоритм, который правдоподобно меняет два наперёд заданных лица местами.
- Face ID. Разобраться в алгоритмах распознавания лиц на фото. Реализовать простейший алгоритм на основе эмбеддингов фотографий (скажем, через SVD-разложение) или какую-то нейросетевую архитектуру на PyTorch. Добиться того, чтобы алгоритм отличал ваше лицо от чужих (скажем, от моего).
- Смена сезонов на фото. Реализовать архитектуру CycleGAN на Pytorch, обучить её на датасетах с изображениями зимних и летних пейзажей, научиться менять сезон на фото. Россия -- страна затяжной зимы. Давайте бороться с этим!
Часов в программе
Цель программы
Актуальность
Входная диагностика 1 час
Итоговая аттестация 4 часа
Компетенции
Профессиональные
Работа с данными в SQL
базовый синтаксис SQL, методологии и технологии проектирования и использования баз данных, особенности системы управления базами данных SQLite
Уметь:извлекать данные из БД и манипулировать ими с помощью SQL
Владеть:навыком извлечения и обработки данных с помощью SQL, навыком работы в SQL Developer
Программирование на языке Python
тип языка, типы и структуры данных, понятие переменной, циклы, условные конструкции, функции, принципы работы алгоритмов, библиотеки Python: seaborn, matplotlib, numpy, pandas
Уметь:решать базовые алгоритмические задачи, загружать и обрабатывать данные (csv, xlsx, txt, json, jpg, etc) с помощью Python и его библиотек, установить Python и библиотеки на ПК, работать в google colab research
Владеть:навыком написания программ на Python, используя его основные синтаксические конструкции, навыком работы в Google Research Colab
Математика для анализа данных
основные концепции логики и комбинаторики, математического анализа, линейной алгебры, теории вероятностей, статистики, теории оптимизации
Уметь:решать базовые задачи из логики и комбинаторики, математического анализа, линейной алгебры, теории вероятностей, статистики, теории оптимизации; уметь описывать алгоритмы на формальном математическом языке.
Владеть:навыком решения базовых математических задач, навыком математического описания алгоритмов
Машинное обучение
основы математического моделирования, основные концепции машинного обучения, виды задач в машинном обучении, способы оценки качества моделей машинного обучения, алгоритм линейной регрессии, алгоритм логистической регрессии, деревья решений, ансамбли алгоритмов, boosting, методы регуляризации, базовые методы обработки табличных данных, текстов, изображений и временных рядов, методы работы с признаками, базовые алгоритмы кластеризации, метрические алгоритмы; библиотеки Python для машинного обучения
Уметь:решать задачи классификации, регрессии, кластеризации с помощью методов машинного обучения, используя Python и его библиотеки
Владеть:навыком в Python и его библиотеках для решения задач машинного и глубокого обучения, навыком работы в Google Recearch Colab
Глубокое обучение
основные задачи, решаемые нейронными сетями; метод обратного распространения ошибки (backpropagation), перцептрон, полносвязные нейронные сети, сверточные нейронные сети, рекуррентные нейронные сети, современные архитектуры нейронных задач для решения задач компьютерного зрения (CV) и обработки текстов (NLP), фреймворки Pytorch, TensorFlow
Уметь:решать задачи классификации, регрессии, кластеризации, обработки изображений и текстов с помощью методов глубокого обучения, Python, его библиотеки и фреймворка Pytorch
Владеть:навыком в Python и его библиотеках, фреймворке Pytorch для решения задач машинного и глубокого обучения, навыком работы в Google Recearch Colab
Требования
Нет
Образование
- Высшее образование
- Среднее профессиональное образование
Модули
свернутьПреподаватели

Мороз
Юлия
АНО ДПО "Корпоративный университет Сбербанка"
Руководитель направления
кандидат наук
доцент

Клименко
Дарья
АНО ДПО "Корпоративный университет Сбербанка"
Ведущий специалист
Указана полная стоимость. Вы сможете получить скидку на этот курс от 50% до 100% по проекту «Цифровые профессии» в зависимости от льготной категории.
Авторизуйтесь чтобы записатьсяПрофстандарт
Специалист по большим данным
06.042Ответственный за программу
digital_professions@sberbank.ru
+79242041352