Большие данные Анализировать данные Python Jupyter Notebook SQL-запрос Tableau Разрабатывать и создавать программы и приложения Хранить данные Писать программный код

Аналитик данных плюс

Яндекс
510,00 часов длительность
Онлайн формат
Базовый уровень
1 поток (закрыт) 25.04.2022-05.07.2023
2 поток (закрыт) 23.05.2022-26.07.2023
3 поток (закрыт) 20.06.2022-30.08.2023
4 поток (закрыт) 18.07.2022-27.09.2023
5 поток (закрыт) 15.08.2022-25.10.2023
6 поток (закрыт) 12.09.2022-22.11.2023

Описание

В течение пяти рабочих дней с момента подачи заявки вам на почту придет письмо, в котором расскажем основные условия программы и особенности обучения в Яндекс Практикуме. Обратите внимание, что письмо может попасть в спам.

Описание профессии

Аналитик данных извлекает из данных смысл, его работа помогать менеджерам принимать решения с опорой на данные, находить точки роста для бизнеса, формулируя и проверяя гипотезы, аргументированно отстаивать свои выводы и представлять результаты исследований. Мы хотим научить вас пользоваться основными инструментами для получения профессии: Python и его библиотеки, Jupyter Notebook, SQL.

Это расширенная программа, и она подойдёт, даже если вы только начинаете разбираться в аналитике данных и не хотите ничего упустить. А если базовые знания уже есть, вы сможете их углубить и заполнить пробелы. 

Зарплата аналитика данных:
Junior — 60 000 рублей
Middle — 110 000 рублей
Senior — от 150 000 рублей
Источник данных: Хабр Карьера

После этого курса у вас за плечами будет год опыта

Это самое ценное, что вы получите. Более 400 часов учёбы, попыток, ошибок, отрицания, гнева, торга, расстройства, принятия, снова попыток и радости, что всё наконец работает. Это сложный, но интересный путь, который изменит вашу жизнь.

Чему вы научитесь на курсе:

  • писать ясный, гибкий, эффективный и работающий код программ на Python, оптимизировать его, находить и исправлять в нем ошибки; 
  • писать и выполнять SQL-запросы; 
  • формулировать и проверять статистические гипотезы;
  • работать с данными в различных форматах, с данными, содержащими категориальные переменные, пропущенные значения, с неструктурированными данными;
  • готовить данные к анализу, строить дата-пайплайны для ETL-процессов;
  • применять методы анализа данных в решении прикладных задач; 
  • представлять результаты своей работы, использовать качественную визуализацию и строить дашборды в dash и Tableau;
  • строить и интерпретировать воронки продаж и событий;
  • узнаете некоторые основы продуктовой и маркетинговой аналитики, получить представление о unit-экономике; 
  • понимать теоретическе основы машинного обучения, математическую статистику и теорию вероятностей на базовом уровне.

За 12 месяцев обучения по 9 часов в неделю вы освоите востребованные навыки аналитика данных, соберёте портфолио из 16+ проектов Практикума и проектов реальных компаний, наших партнёров.

В расширенной программе вас ждёт:

  • 3-недельные спринты вместо 2-недельных, чтобы двигаться в своем темпе и успевать усваивать больше знаний;
  • еженедельные встречи с наставниками-экспертами;
  • дополнительные занятия с экспертами, где вы познакомитесь с более сложными инструментами и узкими областями машинного обучения;
  • больше знаний о статистике и SQL применительно к анализу данных;
  • Мастерская Практикума: дополнительные проекты от бизнес-заказчиков и партнёров и практика на Kaggle;

О компании

Яндекс Практикум — это сервис онлайн-образования, в котором ваш процесс обучения основан на реальных ситуациях. Вы учитесь программированию и с первого урока пишете код; на занятиях по дизайну — работаете с реальными макетами, а на уроках английского сразу начнёте разговаривать. 

 

Почему Яндекс Практикум

Мы изначально спроектировали образовательную среду для онлайн-обучения — вам понадобится компьютер и спокойное место, где вас не будут отвлекать. 

Технологии помогают сделать так, чтобы вам было удобно учиться. Все части курса собраны на одном сайте. Не нужно переключаться
и отвлекаться на что-то ещё. Курсы адаптируются под ваш уровень знаний.

Самостоятельная работа сочетается с регулярным общением с наставниками и возможностью поговорить с поддержкой. Любую проблему можно решить немедленно.

Почему мы верим, что у вас получится:

  • Понятная теория
    Термины и правила подкреплены примерами из жизни. Сложность и длина курса рассчитаны так, чтобы каждую следующую главу вы понимали всё лучше.
  • Онлайн-тренажер
    С первого дня вы учитесь анализу данных на практике. Мы даём знания небольшими частями, которые нужно сразу применить, написав собственный код в онлайн-тренажёре. Пишите код, ошибайтесь, быстро получайте обратную связь и исправляйте ошибки.
     
  • Самостоятельная работа
    Тренажёр — это только часть обучения. Основные навыки вы приобретете по мере решения задач инструментами профессиональных аналитиков, а код-ревьюер даст вам обратную связь. Вас ждут типичные для аналитика задачи из разных сфер бизнеса. Вы решите их и сможете добавить в своё портфолио
     
  • Поддержка
    Команда наставников проверяет и комментирует ваши работы, помогает разобраться в сложностях и обучает собственным профессиональным приёмам аналитики. Техническая поддержка в чате доступна 24/7.

 

78% выпускников Практикума находят работу

 

В этом им помогает особый этап курса — карьерный трек. На нём со студентами работают наши HR-специалисты. Студенты учатся планировать процесс поиска работы, правильно составлять резюме, уверенно держаться на собеседованиях и проходить тестовые задания. Мы разработали эту программу, чтобы каждый выпускник нашёл работу по душе.

78% выпускников находят работу, большинство из них за 4 месяца. Институт образования НИУ ВШЭ подтвердил данные через исследование трудоустройства выпускников.

Часов в программе
110,00 часов
лекции
216,00 часов
практика
65,00 часов
самостоятельная
84,00 часа
промежуточная аттестация
1 час
входная диагностика
35 часов
итоговая аттестация
511,00 часов
всего
Цель программы
Цель программы: получение слушателями профессиональных компетенций в области анализа данных, подготовка специалистов в области анализа данных.
Актуальность
В XXI веке бизнесу и государству особенно важно уметь прогнозировать и предсказывать различные сценарии развития событий, которые повлияют на них. В экономике и других сферах одновременно взаимодействуют множество факторов — от точности прогнозов зависит благосостояние и выживание организаций и стран. Ключевой элемент точных прогнозов — грамотная работа с данными, источники и объём которых значительно увеличиваются ежедневно.
Для это необходимы профессионалы, которые умеют исследовать проблему, формулировать и проверять с помощью инструментов анализа данных гипотезы.
Целью Программы является получение слушателями следующих профессиональных компетенций в области анализа данных:
• способность подготовить данные для анализа
• способность применять анализ данных для решения бизнес-задач
• способность коммуницировать с заказчиком и иными стейкхолдерами проекта для достижения нужного результата
• способность применять для решения задач языки программирования и баз данных, операционные системы, цифровые библиотеки и пакеты программ;
• способность программировать работающие программы на языке Python;
Основная задача программы — подготовить к работе в коммерческих и государственных компаниях специалиста, который владеет теоретическими подходами и концепциями, а также технологическими навыками реализации анализа данных.
Новизна программы состоит в продуманном сочетании теоретической и практической подготовки с постоянной автоматизированной и ручной обратной связью на платформе и от профессионалов-наставников.
Слушатели овладеют инструментами полного цикла прогнозирования развития явлений и значений переменных: от получения и прояснения задачи до очистки и анализа данных, а также решение задачи анализа данных.
Актуальность программы обуславливается растущим спросом на специалистов в области обработки и анализа больших данных.
Входная диагностика 1 час
После подачи заявки вам на почту придет письмо, в котором расскажем основные условия программы и особенности обучения в Яндекс Практикуме.
Итоговая аттестация 35 часов
Дипломный проект

Компетенции

Профессиональные


Основы Python и анализа данных
Знать:

• Основные концепции анализа данных, понимание, чем занимаются аналитики данных и специалисты по Data Science.

Уметь:

• Основы языка программирования Python и библиотеки pandas
• построение некоторых графиков и верная их трактовка.

Владеть:

• Язык программирования Python
• библиотека Pandas
• среда программирования Jupyter Notebook.

Основы анализа данных
Знать:

• Применение Python и Pandas для анализа данных
• Анализ данных и оформление результатов
• Системное и критическое мышление в работе аналитика
• Срезы данных
• Взаимосвязь данных
• Исследовательский анализ данных.

Уметь:

• Умение писать код на Python
• Изменение типов данных
• Работа с пропусками
• Поиск дубликатов
• Предобработка данных
• Категоризация данных
• Работа с несколькими источниками данных
• Валидация результатов
• Проверка гипотез.

Владеть:

• Python — язык программирования общего назначения
• Jupyter Notebook — среда разработки.

Базовый SQL
Знать:

• Введение в базы данных
• Взаимоотношения между таблицами
• Типы объединения таблиц, SQL в анализе данных и машинном обучении.

Уметь:

• Срезы данных в SQL
• Агрегирующие функции
• Группировка и сортировка данных
• Подзапросы и временные таблицы.

Владеть:

• Языка запросов SQL как инструмент работы с данными

Визуализация данных
Знать:

• Подготовка презентации
• Рассказ истории с помощью данных
• Что такое дата-пайплайны и зачем они нужны
• автоматизация.

Уметь:

• Библиотека Seaborn
• Библиотека Plotly
• Основы запуска скриптов
• Проектирование и разработка дашбордов в dash.

Владеть:

• Библиотека Seaborn
• Библиотека Plotly
• dash - инструмент для создания дашбордов с графиками
• Tableau - инструмент визуализации и рабочих листов для аналитики.

Основы продуктовой аналитики
Знать:

• Метрики и воронки
• Когортный анализ
• Юнит-экономика
• Пользовательские метрики.

Уметь:

• Анализ бизнес-показателей
• Расчёт бизнес-показателей
• Основы оконных функций
• Установка и настройка базы данных и клиента базы данных
• Рамки в оконных функциях
• Дополнительные инструменты SQL.

Владеть:

• SQL как инструмент работы с данными
• Jupyter Notebook.

Принятие решений в бизнесе на основе данных
Знать:

• Основы проверки гипотез в бизнесе
• Выбор метода проведения эксперимента
• Приоритизация гипотез
• Поведенческие алгоритмы
• Принятие решений в бизнесе на основе данных.

Уметь:

• Подготовка к проведению A/B-теста
• Анализ результатов A/B-теста.

Владеть:

• SQL как инструмент работы с данными
• Jupyter Notebook.

Статистика
Знать:

• Описательная статистика
• Теория вероятностей
• Статистический анализ данных.

Уметь:

• Умение проверять гипотезы
• статистический анализ данных.

Владеть:

• Python — язык программирования общего назначения
• Jupyter Notebook — среда разработки.

Машинное обучение
Знать:

• Задачи машинного обучения в бизнесе
• Процесс решения задач машинного обучения.

Уметь:

• Алгоритмы машинного обучения, прогнозы и предсказания.

Владеть:

• Python — язык программирования общего назначения
• библиотека машинного обучения Scikit-Learn
• библиотека для математических операций и работы с векторами numpy
• библиотека для градиентного бустинга Catboost.

Требования

Нет

Образование
  • Высшее образование
  • Среднее профессиональное образование

Модули

свернуть
20,00ч
Модуль 1 Основы Python и анализа данных
Узнаете основные концепции анализа данных и поймёте, чем занимаются аналитики данных и специалисты по Data Science. Вы изучите азы Python и библиотеки pandas, научитесь строить некоторые графики и верно их трактовать.
90,00ч
Модуль 3 Введение в SQL и визуализация данных
Изучите основы структурированного языка запросов SQL и операции реляционной алгебры. Познакомитесь с PostgreSQL — популярной системой управления базами данных (СУБД). Научитесь писать запросы разного уровня сложности и переводить бизнес-задачи на язык SQL. Узнаете, как правильно презентовать результаты своего исследования, оперируя графиками, важнейшими цифрами и их правильной интерпретацией. Познакомитесь с библиотеками Seaborn и Plotly. Создадите интерактивные дашборды для разных аудиторий и нужд компании с помощью популярной системы бизнес-аналитики Tableau.
140,00ч
Модуль 5 Статистика и машинное обучение
Научитесь анализировать взаимосвязи в данных методами статистики. Узнаете, что такое статистическая значимость, гипотезы и доверительные интервалы, изучите новые темы и научитесь использовать знания по статистике для решения сложных бизнес-кейсов. Узнаете, что такое A/B-тестирование, и поймёте, в каких случаях его используют. Научитесь проектировать A/B-тестирование, оценивать его результаты. Познакомитесь с основами машинного обучения и узнаете об основных задачах машинного обучения в бизнесе.
110,00ч
Модуль 2 Введение в анализ данных
Глубже погрузитесь в язык программирования Python и работу с библиотекой Pandas. Научитесь очищать данные от выбросов, пропусков и дубликатов, а также преобразовывать разные форматы данных. Изучите основы теории вероятностей и статистики. Примените их для исследования основных свойств данных, поиска закономерностей, распределений и аномалий. Отрисуете диаграммы, поупражняетесь в анализе графиков.
115,00ч
Модуль 4 Основы продуктовой аналитики
Узнаете, что такое метрики в бизнесе. Познакомитесь с продуктовой и маркетинговой аналитикой. Разберётесь, как использовать инструменты для анализа данных в бизнесе: когортный анализ, воронку продаж и юнит-экономику. Научитесь писать код на Python для подсчёта метрик и используете готовые функции для исследования в проекте. С помощью языка SQL разберёте подсчёт основных бизнес-метрик, с которыми вы познакомились в курсе «Анализ бизнес-показателей».
20,00ч
Модуль 1 Основы Python и анализа данных
Узнаете основные концепции анализа данных и поймёте, чем занимаются аналитики данных и специалисты по Data Science. Вы изучите азы Python и библиотеки pandas, научитесь строить некоторые графики и верно их трактовать.
110,00ч
Модуль 2 Введение в анализ данных
Глубже погрузитесь в язык программирования Python и работу с библиотекой Pandas. Научитесь очищать данные от выбросов, пропусков и дубликатов, а также преобразовывать разные форматы данных. Изучите основы теории вероятностей и статистики. Примените их для исследования основных свойств данных, поиска закономерностей, распределений и аномалий. Отрисуете диаграммы, поупражняетесь в анализе графиков.
90,00ч
Модуль 3 Введение в SQL и визуализация данных
Изучите основы структурированного языка запросов SQL и операции реляционной алгебры. Познакомитесь с PostgreSQL — популярной системой управления базами данных (СУБД). Научитесь писать запросы разного уровня сложности и переводить бизнес-задачи на язык SQL. Узнаете, как правильно презентовать результаты своего исследования, оперируя графиками, важнейшими цифрами и их правильной интерпретацией. Познакомитесь с библиотеками Seaborn и Plotly. Создадите интерактивные дашборды для разных аудиторий и нужд компании с помощью популярной системы бизнес-аналитики Tableau.
115,00ч
Модуль 4 Основы продуктовой аналитики
Узнаете, что такое метрики в бизнесе. Познакомитесь с продуктовой и маркетинговой аналитикой. Разберётесь, как использовать инструменты для анализа данных в бизнесе: когортный анализ, воронку продаж и юнит-экономику. Научитесь писать код на Python для подсчёта метрик и используете готовые функции для исследования в проекте. С помощью языка SQL разберёте подсчёт основных бизнес-метрик, с которыми вы познакомились в курсе «Анализ бизнес-показателей».
140,00ч
Модуль 5 Статистика и машинное обучение
Научитесь анализировать взаимосвязи в данных методами статистики. Узнаете, что такое статистическая значимость, гипотезы и доверительные интервалы, изучите новые темы и научитесь использовать знания по статистике для решения сложных бизнес-кейсов. Узнаете, что такое A/B-тестирование, и поймёте, в каких случаях его используют. Научитесь проектировать A/B-тестирование, оценивать его результаты. Познакомитесь с основами машинного обучения и узнаете об основных задачах машинного обучения в бизнесе.
168 000 p
Авторизуйтесь чтобы записаться

Профстандарт

Аналитик данных

06.022

Ответственный за программу