III уровень Искусственный интеллект

Аналитик данных (Data Scientist)

АНО ДПО "Корпоративный университет Сбербанка"
421,00 час длительность
Онлайн формат
Начальный уровень
1 поток (закрыт) 19.06-21.11.2023
2 поток (закрыт) 03.07-15.12.2023

Описание

Data Science (наука о данных) – молодая отрасль на стыке интернет-технологий и бизнеса. Задача исследователя данных (Data Scientist): строить математические модели, которые позволяют выявлять скрытые взаимосвязи в огромных массивах информации. Исследователь данных формирует на основе закономерностей в данных новые ценности, такие как предсказание будущего поведения в зависимости от начальных условий, рекомендации в зависимости от выявленных предпочтений и т.д. Помогает создавать продукты и повышать эффективность бизнес-решений, социальных взаимодействий, научных исследований и производственных процессов на основе выявленных математических моделей. На текущий момент только в одной России больше 5000 компаний находятся в поисках специалистов по Data Science. Средняя зарплата в этой профессии составляет ~100 000 рублей и практически не имеет верхних границ. Сегодня данные – основа успеха всех крупных преуспевающих компаний, которые видят себя лидерами будущего. Данные необходимо собирать, обрабатывать и строить на их основе модели, которые приносят пользу всему человечеству и бизнесу – для этого необходимы специалисты в сфере Data Science.
 

На программе вы научитесь:

  • программировать на Python — одном из самых популярных языков программирования в мире;
  • решать математические задачи, необходимые для работы с алгоритмами машинного обучения и нейронными сетями;
  • проводить первичный анализ данных с помощью библиотек Python: Pandas, Numpy, Seaborn, Matplotlib, etc.;
  • применять алгоритмы машинного обучения для решения прикладных задач;
  • разрабатывать и обучать нейронные сети.

После завершения программы желающие смогут посетить занятия с HR по выстраиванию стратегии поиска работы, получить ревью своего резюме.

Обучение состоит из двух модулей:

  • Модуль 1: Python для анализа данных — онлайн-интенсив из электронных курсов и вебинаров для освоения базовых знаний и умений в математике, программировании и основах первичного анализа данных на Python. Здесь вам предстоит решить большое количество задач на Python в тренажере, разобраться с математическими задачами, необходимыми в машинном обучении, и погрузиться в первичный анализ данных, решая практические домашние задания и разбирая практические кейсы с преподавателем. Итогом этого модуля является защита проекта. Вам нужно будет проанализировать данные онлайн-кинотеатра, подготовить отчет и защитить его.
  • Модуль 2: Машинное Обучение и Нейронные сети — обучение в формате вебинаров под руководством преподавателей-практиков, с интересными ДЗ, персонализированной обратной связью от наставников и проектами! В этом модуле сначала вам предстоит на практике разобраться с основами машинного обучения, пайплайном обработки данных и обучения моделей. В ДЗ вы встретитесь с предсказанием стоимости алмазов как инвестиционных инструментов, анализом показателей здоровья человека, сжатием популярных песен и другими интересными задачами. Финал изучения машинного обучения — защита проекта. Для проекта можно выбрать одну из предложенных на курсе тем, например «Предсказание мошеннических операций в транзакционных банковских данных», либо согласовать с преподавателем индивидуальную. Далее вас ждет погружение в основы глубокого обучения, где вы разберетесь с разработкой и обучением нейронных сетей для CV (компьютерное зрение) и NLP (обработка текстов) с помощью фреймворка PyTorch. А также вы научитесь работать с временными рядами, применяя для их анализа методы как машинного, так и глубокого обучения. Итогом модуля является защита выпускного проекта.

У кого вы будете учиться?

Команда преподавателей, методистов и кураторов с опытом организации обучения Data Science и Data Engineering более 4 лет. Команда сочетает в себе три ключевые экспертизы:

  • индустриальная: практики data engineers и ml/dl engineers из крупнейших российских и международных ИТ-компаний;
  • академическая: преподаватели и выпускники лучших вузов России: ВШЭ, МФТИ, МГУ, Школа Анализа Данных Яндекса, etc.;
  • образовательная: мы обучили уже более 5000 слушателей из российских компаний или вузов.

Во время обучения вы реализуете 3 проекта лично или в команде:

  • первичный анализ данных — составить потенциальному заказчику отчет с описательной статистикой популярности текущих шоу онлайн-кинотеатра, предложить и обосновать на данных гипотезы по повышению основных метрик онлайн-кинотеатра;
  • предобработка данных и обучение ML-моделей — предсказание мошеннических операций в транзакционных банковских данных, анализа стоимости недвижимости или другой проект по согласованию с преподавателем;
  • выпускной проект, тема которого согласуется с преподавателем во время обучения.

Примеры тем выпускных проектов с прошлых потоков (обучение прошли уже сотни слушателей):

  • Style Transfer. Разобраться в классическом алгоритме переноса стиля, реализовать его на PyTorch. Бонус — реализовать любой из алгоритмов нейросетевого переноса стиля.
  • Решить задачу языкового моделирования с помощью реализации и обучения sequence-to-sequence нейронной сети (NLP).
  • Разобраться в нейросетевых архитектурах сегментации изображений и выделения ключевых точек лица. Написать алгоритм, который правдоподобно меняет два наперед заданных лица местами.
  • Face ID. Разобраться в алгоритмах распознавания лиц на фото. Реализовать простейший алгоритм на основе эмбеддингов фотографий (скажем, через SVD-разложение) или какую-то нейросетевую архитектуру на PyTorch. Добиться того, чтобы алгоритм отличал ваше лицо от чужих (скажем, от моего).
  • Автопосты в Instagram. Разработать алгоритм для автоматической генерации постов в Instagram, обучающийся на реальных профилях пользователей.
  • Смена сезонов на фото. Реализовать архитектуру CycleGAN на Pytorch, обучить ее на датасетах с изображениями зимних и летних пейзажей, научиться менять сезон на фото. Россия — страна затяжной зимы. Давайте бороться с этим!
  • Предсказание погоды по метеоданным (временные ряды).

 

Важно!

Перед стартом обучения важно понимать, что программирование и анализ данных — это интересно и перспективно, но и очень сложно. Для достижения целей обучения вам придется много работать, практиковаться и постоянно самостоятельно искать информацию. Без этого не стать хорошим специалистом даже начального уровня. Научить учиться и искать информацию — одна из целей программы, ведь настоящий специалист регулярно занимается этим на работе! Убедитесь, что вы готовы уделять обучению 15, а лучше 20 часов каждую неделю и вы уверены, что сможете освоить основы этой профессии в интенсивном режиме.

Часов в программе
1 час
входная диагностика
4 часа
итоговая аттестация
5 часов
всего
Цель программы
Приобретение и совершенствование компетенций в области программирования на языке Python, математики для анализа данных, машинного и глубокого обучения, необходимых для старта карьеры в сфере Data Science
Актуальность
На текущий момент только в одной России больше 5 000 компаний находятся в поисках специалистов по Data Science; Потребность в таких специалистах огромна в самых разных отраслях экономики РФ. Ведь сегодня данные – основа успеха всех крупных преуспевающих компаний, которые видят себя лидерами будущего. Данные необходимо собирать, обрабатывать и строить на их основе модели, которые приносят пользу всему человечеству и бизнесу – для этого необходимы специалисты в сфере Data Science! Данная программа даст слушателям базовые знания и умения, которые необходимы в работе любого специалиста по работе с данными, чтобы он смог решать задачи бизнеса
Входная диагностика 1 час
Тест проверяет знание основ программирования, базовой математики и логики
Итоговая аттестация 4 часа
Итоговая аттестация по программе является обязательной, проводится в форме защиты проекта в сроки, предусмотренные учебным планом и графиком учебного процесса. Форма и условия аттестационных испытаний определяются настоящей программой.

Требования

  • Готовность упорно учиться, искать информацию и много самостоятельно работать – без этого не стать хорошим разработчиком!
  • Готовность на протяжении всего курса регулярно выделять достаточно времени учебе.
  • Уверенное владение ПК: установка/удаление ПО, работа с текстовыми редакторами, браузером Google Chrome.
  • Развитое логическое мышление, умение структурировать информацию.
  • Отсутствие проблем с школьной математикой. Решение квадратных уравнений и простейших систем линейных уравнений не вызывают проблем. Понимание, как нарисовать графики простейших линейных и квадратичных функций. Умение решать простейшие задачи с участием логарифма и экспоненты.
  • Если все же что-то из списка выше вызывает сомнения, то вам должно быть достаточно просто сесть вечером и повторить эти темы. Обязательно сделайте это, будет полезно перед курсом!
  • Очень желательно знакомство с основами математического анализа: функции и их производные; линейной алгебры: вектора, матрицы и операции с ними; теории вероятностей и статистики.
  • Базовые умения в программировании на любом высокоуровневом языке программирования. Умение решать простейшие алгоритмические задачи
  • Знание английского языка на уровне чтения технической документации.
Образование
  • Высшее образование
  • Среднее профессиональное образование
Квалификация
Образовательная программа предназначена для специалистов, имеющих высшее или среднее профессиональное образование, а также лиц, получающих высшее или среднее профессиональное образование.
Опыт профессиональной дятельности
Опыт программирования
Предварительное освоение иных дисциплин/курсов /модулей
При поступлении на Образовательную программу желательны знания в области:
‒ Высшей математики,
‒ Линейной алгебры,
‒ Информатики,
‒ Теории вероятностей.
Иные требования и рекомендации для обучения по программе
  • Готовность упорно учиться, искать информацию и много самостоятельно работать – без этого не стать хорошим разработчиком!
  • Готовность на протяжении всего курса регулярно выделять достаточно времени учебе.
  • Уверенное владение ПК: установка/удаление ПО, работа с текстовыми редакторами, браузером Google Chrome.
  • Развитое логическое мышление, умение структурировать информацию.
  • Отсутствие проблем с школьной математикой. Решение квадратных уравнений и простейших систем линейных уравнений не вызывают проблем. Понимание, как нарисовать графики простейших линейных и квадратичных функций. Умение решать простейшие задачи с участием логарифма и экспоненты.
  • Если все же что-то из списка выше вызывает сомнения, то вам должно быть достаточно просто сесть вечером и повторить эти темы. Обязательно сделайте это, будет полезно перед курсом!
  • Очень желательно знакомство с основами математического анализа: функции и их производные; линейной алгебры: вектора, матрицы и операции с ними; теории вероятностей и статистики.
  • Базовые умения в программировании на любом высокоуровневом языке программирования. Умение решать простейшие алгоритмические задачи
  • Знание английского языка на уровне чтения технической документации.

Модули

свернуть
Модуль 1 Модуль 1. Python для анализа данных
Модуль включает следующие темы: Основы Python и Алгоритмов, Python и математика, Введение в Первичный Анализ Данных
Модуль 2 Модуль 2. Машинное обучение, глубокое обучение
Модуль 2. Машинное обучение, глубокое обучение
Модуль 1 Модуль 1. Python для анализа данных
Модуль включает следующие темы: Основы Python и Алгоритмов, Python и математика, Введение в Первичный Анализ Данных
Модуль 2 Модуль 2. Машинное обучение, глубокое обучение
Модуль 2. Машинное обучение, глубокое обучение
110 000 p
Авторизуйтесь чтобы записаться

Профстандарт

Специалист по большим данным

06.042

Специальность

Аналитик данных (Data Scientist)

Ответственный за программу