III уровень Большие данные

Основы обработки данных в R

ГБОУ ВО НГИЭУ
72 часа длительность
Онлайн формат
Начальный уровень

Описание

ПЕРЕД НАЧАЛОМ ОБУЧЕНИЯ ВАМ НА ЭЛЕКТРОННУЮ ПОЧТУ ПОСТУПЯТ ИНСТРУКЦИИ

 

В результате успешного освоения образовательной программы будут сформированы основы компетенций «управление информацией и данными», «критическое мышление в цифровой среде» в части, касающейся статистической обработки числовой информации и проверки различных статистических гипотез.

Требования для успешного прохождения программы:

- владение математическим аппаратом на уровне 10-11 класса;

- наличие ПК с операционной системой Windows 2000 и новее, 256 МБ оперативной памяти.

Для успешного прохождения обучения желательно владение основами эконометрики или математической статистики.

По итогам освоения образовательной программы студент:

- получит информацию о простых методах визуализации и статистической обработки данных с использованием R;

- сможет визуализировать числовые данные, проверять статистические гипотезы, в том числе и о наличии между ними взаимосвязей, подбирать оптимальные модели;

- сформирует навыки программирования, анализа статистических данных на языке R и поиска информации в экосистеме R для решения в дальнейшем более сложных задач;

Это позволит обучающемуся проводить простой анализ данных в области своей профессиональной деятельности.

Цель программы
Сформировать у обучающегося навыки визуализации статистической информации и анализа числовых данных, построения выводов о соответствующих зависимостях между переменными в полученных данных

Требования

Среднее профессиональное или высшее образование

Иные требования и рекомендации для обучения по программе

Среднее профессиональное или высшее образование

Модули

свернуть
Модуль 1 Модуль 1 «Знакомство с экосистемой R»
Что такое R, установка и экосистема Практика 1. Основа работы с R Индивидуальное задание 1. Работа в экосистеме R
Модуль 3 Модуль 3 «Линейная регрессия»
Лекция 4. Статистические гипотезы, их формулировка, этапы проверки, основные используемые виды гипотез Лекция 5. Проверка статистических гипотез в R Тест 2. Визуализация данных и проверка статистических гипотез в R Лекция 6. Случайные величины и работа с ними в R Практика 4. Работа со случайными величинами в R Индивидуальное задание 2. Работа с переменными в R Лекция 7. МНК. Линейная регрессия. Оценки коэффициентов. Условия Гаусса-Маркова. Критерии качества модели Тест 3. Статистические распределения и интерпретация результатов линейной регрессии Практика 5. Построение уравнений парной линейной регрессии Лекция 8. Множественная регрессия и ее интерпретация Практика 6. Построение уравнений множественной линейной регрессии Лекция 9. Сравнение качества моделей, методы отбора признаков Практика 7. Методы отбора признаков в модель Индивидуальное задание 3. Проверка статистических гипотез, анализ зависимости между переменными
Модуль 5 Модуль 5 «Исправление некорректных моделей»
Лекция 11. Проверка выполнимости условий Гаусса-Маркова, методы проверки моделей на качество, квантильная регрессия Практика 10. Проверка выполнимости условий Гаусса-Маркова Практика 11. Преобразования моделей Практика 12. Квантильная регрессия Лекция 12. Регрессия с регуляризацией Практика 13. Регрессия с регуляризацией Индивидуальное задание 5. Исправление некорректных моделей
Модуль 2 Модуль 2 «Основы статистики и графики»
Лекция 2. Типы и базы данных в R Практика 2. Работа с базами данных в R Тест 1. Базовые пакеты и функции в R Лекция 3. Графики в R Практика 3. Построение графиков в R
Модуль 4 Модуль 4 «Кросс-валидация»
Лекция 10. Виды кросс-валидации Практика 8-9. Реализация различных методов кросс-валидации Индивидуальное задание 4. Построение лучшей модели регрессии
Модуль 1 Модуль 1 «Знакомство с экосистемой R»
Что такое R, установка и экосистема Практика 1. Основа работы с R Индивидуальное задание 1. Работа в экосистеме R
Модуль 2 Модуль 2 «Основы статистики и графики»
Лекция 2. Типы и базы данных в R Практика 2. Работа с базами данных в R Тест 1. Базовые пакеты и функции в R Лекция 3. Графики в R Практика 3. Построение графиков в R
Модуль 3 Модуль 3 «Линейная регрессия»
Лекция 4. Статистические гипотезы, их формулировка, этапы проверки, основные используемые виды гипотез Лекция 5. Проверка статистических гипотез в R Тест 2. Визуализация данных и проверка статистических гипотез в R Лекция 6. Случайные величины и работа с ними в R Практика 4. Работа со случайными величинами в R Индивидуальное задание 2. Работа с переменными в R Лекция 7. МНК. Линейная регрессия. Оценки коэффициентов. Условия Гаусса-Маркова. Критерии качества модели Тест 3. Статистические распределения и интерпретация результатов линейной регрессии Практика 5. Построение уравнений парной линейной регрессии Лекция 8. Множественная регрессия и ее интерпретация Практика 6. Построение уравнений множественной линейной регрессии Лекция 9. Сравнение качества моделей, методы отбора признаков Практика 7. Методы отбора признаков в модель Индивидуальное задание 3. Проверка статистических гипотез, анализ зависимости между переменными
Модуль 4 Модуль 4 «Кросс-валидация»
Лекция 10. Виды кросс-валидации Практика 8-9. Реализация различных методов кросс-валидации Индивидуальное задание 4. Построение лучшей модели регрессии
Модуль 5 Модуль 5 «Исправление некорректных моделей»
Лекция 11. Проверка выполнимости условий Гаусса-Маркова, методы проверки моделей на качество, квантильная регрессия Практика 10. Проверка выполнимости условий Гаусса-Маркова Практика 11. Преобразования моделей Практика 12. Квантильная регрессия Лекция 12. Регрессия с регуляризацией Практика 13. Регрессия с регуляризацией Индивидуальное задание 5. Исправление некорректных моделей

Преподаватели

Черемухин

Артем Дмитриевич

ГБОУ ВО НГИЭУ
Авторизуйтесь чтобы записаться

Ответственный за программу