Модуль 3
161,00ч

Программирование в анализе данных: SQL и Python

1.Основы SQL
2.Агрегатные функции
3.Соединение таблиц
4.Сложные объединения
5.Подзапросы
6.Визуализация: графики и дашборды
7.Условные операторы
8.Сквозная маркетинговая аналитика
9.Типы данных и работа со строками
10.Сегментация и измерения
Часов в программе
39,00 часов
лекции
59,00 часов
практика
57,00 часов
самостоятельная
6,00 часов
промежуточная аттестация
161,00 час
всего
Материально-технические условия реализации программы:
Вид занятий: внеаудиторные
Требуемое ПО:
Операционная система: Windows 7, 10/Apple macOS 10.12
Процессор: Intel Core i5 7500
Оперативная память: 8 ГБ
Видеокарта: Nvidia GeForce 600 / AMD HD 7000
Стабильный интернет: от 5/мбит с

Учебно-методические материалы

Методы, формы и технологии

Формы подачи материала:
-видео
-текст
Методы:
-асинхронная работа студента на платформе
-синхронная работа на вебинарах с преподавателями
-самостоятельная работа (выполнение заданий)

Методические разработки

Анализ рынок конкурентов — изучаем, что предлагают другие школы и рынок вакансий, чтобы давать востребованные знания и навыки.
Проработка критериев по набору экспертов и авторов программы
Разработка контента в обучающие материалы и проектирование структуры курса
Анализ рынка вакансий на предмет актуальности знаний.
Создание авторами модулей программы. Каждый урок проходит многоуровневое ревью — эксперта, методиста, редактора, студента-тестировщика.
Чередование форматов подачи информации (текст — видео— таблица). Обязательно предоставление ссылок на дополнительные источники — документацию и полезные статьи, которые помогут лучше понять тему и расширят кругозор студента
В конце каждой темы у нас есть:
итоговое тестирование, чтобы привести знания теории в систему,
большая практическая задача для закрепления всех необходимых навыков модуля.
Обработка обратной связи от студентов по каждому модулю.

Материалы курса

Материалы курса:
Магия букв: БД, СУБД и SQL
С чем будем работать?
Получаем все данные из таблицы
Фильтруем строки
Сортировка
Ограничение вывода
Знакомимся с данными
Убираем повторяющиеся значения
Агрегатные функции
Группировка
Фильтрация агрегированных строк
Знакомимся с данными
Соединение таблиц по ключу
Знакомимся с JOIN
Фильтрация и агрегатные функции
Способы соединения таблиц
Знакомимся с данными
UNION
UNION и ограничение типов данных
UNION ALL и промежуточные итоги
UNION и дополнительные условия
UNION и ручная генерация
EXCEPT
INTERSECT
SELECT FROM SELECT
SELECT в WHERE
SELECT в JOIN
CTE (Common Table Expressions)
Закрепление знаний
Задача этого кейса
Получение данных
Преобразование данных
Работа с типами данных
Удаление столбцов
Объединение таблиц и прочее редактирование
Создание модели данных
Что такое DAX?
Вычисления в Power BI: DAX
Визуальные элементы в Power BI
KPI-метрики и формат данных
Строим дашборд: основы
Строим дашборд: добавляем интерактивности
Как работать с Power BI Service?
Формулируем выводы
Оператор CASE
CASE и агрегатные функции
CASE: упрощённый синтаксис
Оператор NULLIF
Оператор COALESCE
BASICS. GameDev
THEORY. Сквозная маркетинговая аналитика
THEORY. Определение источников привлечения
SETTING. Ваши задачи
PRACTICE. Знакомство с данными
PRACTICE. Сбор и обработка данных
PRACTICE. Анализ данных
PROJECT. Оцениваем эффективность кампаний
Типы данных в PostgreSQL
Даты: основные типы
Функции и операторы для работы с датами
Строковые данные: основные типы
Функции и операторы для работы со строками
THEORY. Сегментация
SETTING. Ваши задачи
PRACTICE. Знакомство с данными
PRACTICE. Сбор и обработка данных
PRACTICE. Анализ данных
PRACTICE. Оформление результатов
PROJECT. Сегментация месячных когорт
BASICS. Полезно знать
SETTING. Ваши задачи
PRACTICE. Описание данных
PRACTICE. Шаг 1: Определяем эффективность продаж
PRACTICE. Шаг 2: Составляем портрет клиента
PRACTICE. Шаг 3: Анализируем логистику компании
Введение в программирование и Python
Почему мы выбираем Python?
Как работать с документацией по Python
Hello, World!
Переменные и ввод/вывод данных
Типы данных и их классификация
Числовые типы данных
Типы данных: строки
Списки и кортежи
Типы данных: словарь
Типы данных: множества
Методы обработки строк
Регулярные выражения
Работа с текстовыми файлами
Распознавание дат
Операции с датами
О Pandas
Pandas.Series
Pandas.DataFrame
Работа с различными источниками данных в Pandas
Знакомимся с данными
Исследование структуры DataFrame
Статистические методы
Фильтрация данных в DataFrame
Что такое группировка данных
Подсчет количества по группам
Группировка данных
Сводные таблицы
THEORY. Анализ функциональности
SETTING. Ваши задачи
SETTING. Знакомство с данными
PRACTICE. Сбор и обработка данных
PRACTICE. Анализ данных: Шаг 1
PRACTICE. Анализ данных: Шаг 2
PRACTICE. Анализ данных: Шаг 3
PRACTICE. Проверка аналитической гипотезы
PROJECT. Исследование поведения пользователей
Объединение датафреймов как в SQL JOIN
Работа с множеством файлов и склеивание датафреймов
Возможности визуализации
Обзор типов визуализации
Знакомимся с данными
Графические возможности библиотеки Pandas
Графические возможности библиотеки Matplotlib
Графические возможности библиотеки Seaborn
Графические возможности библиотеки Plotly
Искусство визуализации
SETTING. Ваши задачи
SETTING. Описание данных
PROJECT. Задание и критерии оценки
Библиотека request и курсы валют
Данные из интернета и работа с API
HTML-таблицы
Введение в API
О Яндекс.Метрике
Авторизация в сервисах Яндекса
Параметры запросов
Получение и анализ данных
Работа со структурой отчёта
Использование ETL/ELT
Примеры коробочных и кастомных подходов к решению задач
Оценка решения (кейс)
BASICS. On-demand
BASICS. Формализация задачи
THEORY. Модели атрибуции
SETTING. Ваши задачи
PRACTICE. Сбор и обработка данных
PRACTICE. Анализ данных
PROJECT. Определяем количество ботов на сайте
PostgreSQL: Установка и подключение
Работа с таблицами
Psycopg2: Установка и соединение
Курсор
Транзакции
Простые операции CRUD
Продвинутые операции CRUD
Работа с данными на диске
Ваши задачи
Пропущенные значения
Дубли
Преобразование в datetime
Извлечение признаков времени
И снова о пропусках
Есть ли смысл играть?
Сколько можно выиграть/проиграть?
Объединяем датасеты
Анализ данных
Проверяем знания
BASICS. Что такое фича и зачем её оценивать?
THEORY. Как провести оценку фичи и сформулировать выводы?
SETTING. Ваши задачи
PRACTICE. Сбор и обработка данных
PRACTICE. Анализ данных
PROJECT. Оценка эффективности новой фичи

Учебная литература

Python и анализ данных / Уэс Маккини — М.: ДМК-Пресс 2020. — 540 с. - ISBN: 978-5-97060-590-5 (ОПК-3, ПК-4)
SQL для хранения, обработки и анализа данных/Туманов В.Е. - М.: Солон-Пресс, 2021 - 172 с. - ISBN: 978-5-91359-463-1 (ОПК-3, ПК-4).
Сделай наглядно! Как визуализировать данные понятно и убедительно/Беринато Скотт - М.: Бомбора, 2021 - 264 с. - ISBN: 978-5-04-104358-2 (ОПК-3, ПК-4).

Темы

Основы SQL Агрегатные функции Соединение таблиц Сложные объединения Подзапросы Визуализация: графики и дашборды Условные операторы Сквозная маркетинговая аналитика Типы данных и работа со строками Сегментация и измерения Основы Python Структуры данных Строковые величины Работа с датами Введение в Pandas Методы группировки данных Исследование поведения пользователей Объединение таблиц Методы визуализации данных Данные из интернета и работа с API Вконтакте API Яндекс.Метрики ETL/ELT процессы Исследование каналов привлечения Работа с базами данных Feature Engineering Оценка продуктовой фичи
Лекции
1,00ч
Практические занятия
2,00ч
Самостоятельная работа
2,00ч
Всего
5,00ч
Лекции
1,00ч
Практические занятия
2,00ч
Самостоятельная работа
1,00ч
Всего
4,00ч
Лекции
2,00ч
Практические занятия
2,00ч
Самостоятельная работа
2,00ч
Всего
6,00ч
Лекции
2,00ч
Практические занятия
3,00ч
Самостоятельная работа
1,00ч
Всего
6,00ч
Лекции
1,00ч
Практические занятия
1,00ч
Самостоятельная работа
1,00ч
Всего
3,00ч
Лекции
1,00ч
Практические занятия
2,00ч
Самостоятельная работа
1,00ч
Всего
4,00ч
Лекции
2,00ч
Практические занятия
3,00ч
Самостоятельная работа
1,00ч
Всего
6,00ч
Лекции
1,00ч
Практические занятия
2,00ч
Самостоятельная работа
2,00ч
Всего
5,00ч
Лекции
2,00ч
Практические занятия
2,00ч
Самостоятельная работа
4,00ч
Всего
8,00ч
Лекции
1,00ч
Практические занятия
2,00ч
Самостоятельная работа
2,00ч
Всего
5,00ч
Лекции
1,00ч
Практические занятия
2,00ч
Самостоятельная работа
17,00ч
Всего
20,00ч
Лекции
2,00ч
Практические занятия
2,00ч
Самостоятельная работа
2,00ч
Всего
6,00ч
Лекции
1,00ч
Практические занятия
3,00ч
Самостоятельная работа
1,00ч
Всего
5,00ч
Лекции
1,00ч
Практические занятия
2,00ч
Самостоятельная работа
2,00ч
Всего
5,00ч
Лекции
1,00ч
Практические занятия
2,00ч
Самостоятельная работа
2,00ч
Всего
5,00ч
Лекции
2,00ч
Практические занятия
3,00ч
Самостоятельная работа
1,00ч
Всего
6,00ч
Лекции
2,00ч
Практические занятия
2,00ч
Самостоятельная работа
2,00ч
Всего
6,00ч
Лекции
2,00ч
Практические занятия
3,00ч
Самостоятельная работа
1,00ч
Всего
6,00ч
Лекции
2,00ч
Практические занятия
3,00ч
Самостоятельная работа
1,00ч
Всего
6,00ч
Лекции
1,00ч
Практические занятия
2,00ч
Самостоятельная работа
2,00ч
Всего
5,00ч
Лекции
2,00ч
Практические занятия
3,00ч
Самостоятельная работа
1,00ч
Всего
6,00ч
Лекции
2,00ч
Практические занятия
2,00ч
Самостоятельная работа
2,00ч
Всего
6,00ч
Лекции
2,00ч
Практические занятия
2,00ч
Самостоятельная работа
1,00ч
Всего
5,00ч
Лекции
1,00ч
Практические занятия
2,00ч
Самостоятельная работа
2,00ч
Всего
5,00ч
Лекции
1,00ч
Практические занятия
2,00ч
Самостоятельная работа
2,00ч
Всего
5,00ч
Лекции
2,00ч
Практические занятия
3,00ч
Самостоятельная работа
1,00ч
Всего
6,00ч
Промежуточная аттестация 6,00 часов
Проект