III уровень Большие данные

Data Science: рекомендательные системы

Нетология
348,00 часов длительность
Онлайн формат
Начальный уровень
1 поток (закрыт) 23.05.2022-08.05.2023
2 поток (закрыт) 20.06.2022-05.06.2023
3 поток (закрыт) 22.08.2022-07.08.2023
4 поток (закрыт) 24.10.2022-09.10.2023

Описание

О профессии

Специалист по рекомендательным системам может предсказать кратковременные тренды в любой сфере. Он анализирует внутренние данные бизнеса предпочтения клиентов, строит оценочные кредитные системы, создаёт математические модели. 

<span style="font-weight: 400;">Рекомендательные системы прочно вошли в нашу жизнь и даже ей немного управляют. Сложно представить какой-либо музыкальный или киносервис без рубрики «вам может понравиться».</span>

Средняя зарплата в Data Science через год работы – 200 000 ₽, по данным исследования hh.ru.

Освойте высокооплачиваемую профессию со скидкой. Государство оплатит от 50% до 100% стоимости обучения. 

 

Кому будет полезен этот курс

Новичкам в Data Science

Вы научитесь создавать сайты и веб-приложения на языке JavaScript и станете квалифицированным специалистом в frontend-разработке. 

Разработчикам

Курс даёт хорошую базу для перехода из программирования в Data Science и анализ больших данных. Вас ждёт много практической работы, разбор кейсов и новые полезные знакомства.

Аналитикам

Вы научитесь извлекать максимум из больших массивов данных для быстрой проверки гипотез и построения прогнозов. Систематизируете знания и углубитесь в сферу Data Science.

 

О Нетологии

Нетология — образовательная платформа. Обучаем современным востребованным профессиям. 35+ тыс. дипломированных выпускников, 10 лет на рынке и 8 направлений обучения.

 

Наши преимущества

  • Преподаватели из крупнейших IT-компаний России
  • Обучение на практике и подробная обратная связь
  • Готовые кейсы в портфолио и помощь в их оформлении
  • Помощь с трудоустройством и поддержка на всех этапах
  • Диплом государственного образца 
  • Возможность получить налоговый вычет — 13%

 

Чему вы научитесь

  • Получать данные из внешних источников
  • Выявлять скрытые аномалии в данных
  • Автоматизировать работу с большими массивами
  • Строить модели машинного обучения
  • Формулировать и проверять гипотезы
  • Обосновывать выводы, сделанные на основании данных

По каждому блоку вы выполните домашние задания и получите подробную обратную связь.

 

Как проходит обучение

  • Смотрите видеолекции и участвуете в вебинарах
  • Закрепляете знания на практике
  • Создаете проект в портфолио
  • Получаете диплом и находите новую работу

 

Диплом подтвердит вашу квалификацию

Мы обучаем по государственной лицензии. При успешной защите итоговых проектов вы получите диплом, который сможете добавить к резюме и показать при устройстве на работу.

 

Трудоустройство

Поможем найти работу после обучения. У вас будет возможность работать из дома и получать конкурентную зарплату.

  • Поможем составить дорожную карту поиска работы
  • Научим проходить интервью
  • Поможем оформить резюме и портфолио ваших работ
  • Научим находить вакансии под выбранную профессию

 

Часов в программе
139,00 часов
лекции
134,00 часа
практика
34,00 часа
промежуточная аттестация
1 час
входная диагностика
40 часов
итоговая аттестация
348,00 часов
всего
Цель программы
Формирование у слушателей компетенций, необходимых для профессиональной деятельности по созданию и сопровождению информационных систем, автоматизирующих задачи организационного управления и бизнес-процессы в организациях различных форм собственности с целью повышения эффективности деятельности организаций - пользователей информационных систем.
Актуальность
Бизнес всё больше нуждается в Data Science. Спрос на специалистов появился в связи с активным ростом продуктовых направлений. При этом на рынке острый дефицит кадров. В 2021 году на одну вакансию приходилось менее 3 резюме при норме для рынка в 5–6 предложений. Работодатели готовы нанимать специалистов без опыта, развивать их и платить высокие зарплаты.

Зарплата специалиста по данным исследования HeadHunter:

100 000 ₽ – 150 000 ₽ зарабатывает junior-специалист
200 000 ₽ – 250 000 ₽ зарабатывает middle-специалист
300 000 ₽ – 350 000 ₽ зарабатывает senior-специалист
Входная диагностика 1 час
Входное тестирование на определение уровня базовых знаний в аналитике
Итоговая аттестация 40 часов
Дипломная работа

Компетенции

Профессиональные


Работа с базами данных в SQL
Знать:

• знать архитектуру и структуру базы данных в общем виде
• понимать алгоритм применения аналитических функций SQL
• ориентироваться в разных форматах файлов

Уметь:

• писать простые SQL запросы, чтобы получать данные из базы данных (БД)
• писать джоины, чтобы создавать новые таблицы
• группировать, фильтровать данные из БД
• импортировать и экспортировать данные в БД
• работать с разными форматами файлов

Владеть:

• использовать базу данных PostgreSQL, чтобы хранить данные
• использовать аналитические функции SQL, чтобы изучать характеристики данных

Анализ данных в Python
Знать:

• знание основ Python и основ системы контроля версий

Уметь:

• умение работать с библиотеками для анализа данных (numpy, scipy, pandas)
• умение работать со статистикой в Python (Основы описательной статистики, статистический анализ данных, методы математической оптимизации)

Владеть:

• владение инструментами Python (знание базовых и продвинутых типов данных, циклов, функций и классов)

Feature engineering и предобработка данных
Знать:

• знать, как проверять данные на полноту, целостность, валидность, правильность, наличие шумов, ошибок и пропусков
• понимать, как осуществлять сокращение размерности данных алгоритмами PCA, LDA, NMF с помощью sklearn

Уметь:

• уметь описывать основные проблемы данных
• уметь удалять шумы в данных, ошибочные знания, пропуски с помощью numpy и pandas
• уметь обрабатывать текстовые данные, чтобы передавать их в алгоритмы машинного обучения

Владеть:

• использование алгоритмов PCA, LDA, NMF с помощью sklearn для сокращения размерности данных

Построение модели обучения
Знать:

• знать базовые алгоритмы машинного обучения с помощью библиотеки sklearn
• знать алгоритмы кластеризации
• определять критерии точности модели

Уметь:

• строить деревья решений
• строить модель логистической регрессии
• использовать кросс-валидацию и регуляризацию, чтобы бороться с переобучением
• строить линейную и полиноминальную регрессию
• строить ансамбли моделей

Владеть:

• использовать GridSearch и RandomizedSearch, Model Specific CV, Out of Bag approach для подбора параметров модели
• использовать Random Forest в задачах классификации

Построение и комбинирование рекомендательных систем
Знать:

• знать особенности построения user-based или item-based коллаборативную модель
• знать особенности масштабируемой рекомендательной модели с помощью пакета implicit
• знать, как объединить системы разного типа в гибридные

Уметь:

• уметь строить рекомендательные системы на основе содержания объектов
• уметь строить user-based или item-based коллаборативную модель
• уметь строить масштабируемую рекомендательную модель с помощью пакета implicit
• уметь разрешать проблемы холодного старта
• уметь объединять системы разного типа в гибридные

Владеть:

• использование пакета implicit для построения масштабируемой рекомендательной модели

Требования

Нет

Образование
  • Высшее образование
  • Среднее профессиональное образование

Модули

свернуть
60,00ч
Модуль 1 Старт в профессии. SQL
Узнаете, как будет организовано обучение на курсе, научитесь пользоваться личным кабинетом Нетологии, работать в учебном чате и быстро находить нужную информацию. Модуль поможет улучшить навыки работы с ПК и интернетом. Вы попрактикуетесь в решении повседневных аналитических задач, научитесь мыслить и рассуждать как аналитик. Познакомитесь с центром развития карьеры Нетологии и построите план по поиску работы во время дальнешего обучения на курсе. В идеальном мире data scientist получает готовые данные, чтобы строить модели, но мир неидеален. Вы научитесь с помощью SQL получать данные из БД, фильтровать, агрегировать, а также импортировать и экспортировать.
55,00ч
Модуль 3 Математика для анализа данных
Научитесь проверять данные на полноту, целостность, валидность, наличие шумов, ошибок и пропусков. Узнаете, как очищать данные с помощью NumPy и pandas, как сокращать размерности данных алгоритмами PCA, LDA, NMF. Научитесь строить деревья решений и модели логистической, линейной и полиномиальной регрессии. Узнаете, как использовать Random Forest в задачах классификации.
83,00ч
Модуль 2 Python для анализа данных
Вы научитесь пользоваться базовыми инструментами и подходами в Python, чтобы начать работать с данными. Повторите основы линейной алгебры, теории множеств, методов математической оптимизации, описательной статистики, статистического анализа данных, а также научитесь реализовывать это на языке Python.
109,00ч
Модуль 4 Машинное обучение. Рекомендательные системы
Научитесь проверять данные на полноту, целостность, валидность, наличие шумов, ошибок и пропусков. Узнаете, как очищать данные с помощью NumPy и pandas, как сокращать размерности данных алгоритмами PCA, LDA, NMF. Научитесь строить деревья решений и модели логистической, линейной и полиномиальной регрессии. Узнаете, как использовать Random Forest в задачах классификации. Научитесь строить простые полносвязанные сети уровня LeNet и AlexNet и экспериментировать с их обучением. Получите теоретическую и практическую базу для использования НС в блоках CV и NLP. Научитесь строить персонализированные и неперсонализированные рекомендательные системы, а также комбинировать их.
60,00ч
Модуль 1 Старт в профессии. SQL
Узнаете, как будет организовано обучение на курсе, научитесь пользоваться личным кабинетом Нетологии, работать в учебном чате и быстро находить нужную информацию. Модуль поможет улучшить навыки работы с ПК и интернетом. Вы попрактикуетесь в решении повседневных аналитических задач, научитесь мыслить и рассуждать как аналитик. Познакомитесь с центром развития карьеры Нетологии и построите план по поиску работы во время дальнешего обучения на курсе. В идеальном мире data scientist получает готовые данные, чтобы строить модели, но мир неидеален. Вы научитесь с помощью SQL получать данные из БД, фильтровать, агрегировать, а также импортировать и экспортировать.
83,00ч
Модуль 2 Python для анализа данных
Вы научитесь пользоваться базовыми инструментами и подходами в Python, чтобы начать работать с данными. Повторите основы линейной алгебры, теории множеств, методов математической оптимизации, описательной статистики, статистического анализа данных, а также научитесь реализовывать это на языке Python.
55,00ч
Модуль 3 Математика для анализа данных
Научитесь проверять данные на полноту, целостность, валидность, наличие шумов, ошибок и пропусков. Узнаете, как очищать данные с помощью NumPy и pandas, как сокращать размерности данных алгоритмами PCA, LDA, NMF. Научитесь строить деревья решений и модели логистической, линейной и полиномиальной регрессии. Узнаете, как использовать Random Forest в задачах классификации.
109,00ч
Модуль 4 Машинное обучение. Рекомендательные системы
Научитесь проверять данные на полноту, целостность, валидность, наличие шумов, ошибок и пропусков. Узнаете, как очищать данные с помощью NumPy и pandas, как сокращать размерности данных алгоритмами PCA, LDA, NMF. Научитесь строить деревья решений и модели логистической, линейной и полиномиальной регрессии. Узнаете, как использовать Random Forest в задачах классификации. Научитесь строить простые полносвязанные сети уровня LeNet и AlexNet и экспериментировать с их обучением. Получите теоретическую и практическую базу для использования НС в блоках CV и NLP. Научитесь строить персонализированные и неперсонализированные рекомендательные системы, а также комбинировать их.

Преподаватели

Сапрыкин

Артур

Нетология

Data Scientist

Баданина

Наталья

ООО "КВАЗАР"

Инженер по машинному обучению

Миронов

Алексей

Сбербанк

Ведущий инженер по разработке

85 000 p
Авторизуйтесь чтобы записаться

Профстандарт

Специалист по большим данным

06.042

Ответственный за программу

support@netology.ru

+78002008167