Модуль 1
126,00ч

МОДУЛЬ 1. ОСНОВНОЙ

Модуль предполагает введение в аналитику больших данных, технологии анализа данных, а также изучение основ работы с базами данных. Отдельные темы посвящены Map Reduce, Hadoop; основам Рython и его особенностям; платформам: Jupyter notebook, kaggle, Nvidia Cuda, средам разработки: VS, IntelliJIdea; математическому и числовому анализу с помощью библиотек Numpy, Scikit-learn, практическому применению библиотек. Будут изучены методы статистического и описательного анализа данных; способы анализа данных в R, введение в Data Mining; готовые комплексные решения анализа данных, EDA. Будут рассмотрены BI-системы и визуализация данных; основы языка SQL и реляционные базы данных, базы данных NoSQL; Data Lake
Часов в программе
36,00 часов
лекции
60,00 часов
практика
26,00 часов
самостоятельная
4,00 часа
промежуточная аттестация
126,00 часов
всего
Материально-технические условия реализации программы:
Вид занятий: Лекционные занятия
Требуемое ПО:
Веб-браузеры Google Chrome, Mozila Firefox, Opera, Microsoft Edge, Яндекс.Браузер и др.
Вид занятий: Практические занятия, самостоятельная работа
Требуемое ПО:
Веб-браузеры Google Chrome, Mozila Firefox, Opera, Microsoft Edge, Яндекс.Браузер и др.
Anaconda 2.7 или 3.5
Доступ к облачным вычислительным ресурсам
Информационные ресуры
1. https://национальныепроекты.рф/projects/tsifrovaya-ekonomika
2. https://национальныепроекты.рф/projects/tsifrovaya-ekonomika/p-iskusstvennyy-intellekt-p
3. https://ai.2035.university/
4. https://sprint.1t.ru/
5. https://trends.rbc.ru/trends/tag/ai
Образовательные ресуры
1. https://fpmi-edu.ru/free-de
2. https://stepik.org/course/101687/promo
3. http://www.intuit.ru/studies/professional_retraining/953/courses/214/lecture/5508/
4. https://ru.coursera.org/specializations/gcp-data-machine-learning#courses
5. https://www.coursera.org/specializations/big-data
6. https://mlcourse.ai/book/index.html

Учебно-методические материалы

Методы, формы и технологии

Для достижения планируемых результатов обучение строится с использованием следующих:
методов: case-study, метод проектов, модульное обучение, проблемное обучение, контекстное обучение;
форм: лекции с использованием мультимедиа, практические занятия, самостоятельная работа, практика на базе привлекаемой организации.

Кроме того, обучение строится с применением технологий электронного обучения и дистанционных образовательных технологий.

Методические разработки

Обучающие материалы дисциплины представлены в виде видеолекций, текстовых и графических материалов, размещенных на образовательной платформе sprint.1T.

Материалы курса

Видеолекции
Текстовые материалы лекций
Инструкции для выполнения заданий
Обучающие задания с автоматизированной системой проверки и подсказками
Проверочные задания с автоматизированной системой проверки

Учебная литература

1. Nelli F. Python data analytics with Pandas, NumPy, and Matplotlib. – 2018.
2. Liu Q. et al. Stock market prediction with deep learning: The case of China //Finance Research Letters. – 2022. – Т. 46. – С. 102209.
3. Томас Дэвенпорт. Внедрение искусственного интеллекта в бизнес-практику. Преимущества и сложности − Альпина Паблишер, 2021. – 316 с. ISBN 978-5-9614-3952-6.
4. Маккинни У. Python и анализ данных – Litres, 2022.
5. Келлехер Д., Тирни Б. Наука о данных: Базовый курс – Альпина Паблишер, 2020.
6. Ковалев, С.М.; Ковалев В.М. Настольная книга аналитика // Практическое руководство по проектированию бизнес-процессов и организационной структуры: Практическое руководство. 1С-Паблишинг. – 2020.
7. Каменнова, М.С.; Машков И.В.; Крохин В.В. Моделирование бизнес-процессов В 2 ч. Часть 2. – 2019.
8. Деревянко, М.Э.; Нилова Н.М. Обзор современных информационных систем управления бизнес-процессами – 2021.
9. Еременко К. Работа с данными в любой сфере: как выйти на новый уровень, используя аналитику – Альпина Паблишер, 2019.
10. Понкин, И.В.; Лаптева А.И. Методология научных исследований и прикладной аналитики: учебник – 2 изд., доп. и перераб. – 2021.
11. Большие данные в социальных и гуманитарных науках: Сб. обзоров и рефератов / РАН. ИНИОН. Центр науч.-информ. исслед. по науке, образованию и технологиям; отв. ред. – Гребенщикова Е.Г. – М., 2019. – 193 с. – (Сер.: Наука, образование и технологии). ISBN 978-5-248-00912-1.
12. Маймина, Э.В. К проблеме определения функционала бизнес-аналитики // Вестник Белгородского университета кооперации, экономики и права. – 2019. – №. 2. – С. 66-77.
13. Мороз, Н.Ю. и др. БИЗНЕС-АНАЛИЗ — СОВРЕМЕННАЯ КОНЦЕПЦИЯ АНАЛИТИЧЕСКОЙ ПРАКТИКИ // Естественно-гуманитарные исследования. – 2022. – №. 40 (2). – С. 419-423.
14. Огурцова, Е.Ю.; Фадеев, Р.Н. Большие данные и цифровая аналитика в университетском образовании // Ноосферные исследования. – 2021. – №. 4. – С. 37-44.
15. Поспелов А., Горин Я., Абрамова Л.А. Актуальность системного анализа в современном обществе // История, современное состояние и перспективы инновационного. – 2020. – С. 96.
16. Садовский, Г.Л. Применение больших данных и систем аналитики для эффективного управления проектами // Управление научно-техническими проектами. – 2020. – С. 225-228.
17. Ширинкина, Е.В. Методы интеллектуального анализа данных и образовательной аналитики // Современное образование. – 2022. – №. 1. – С. 51-67.
18. Чернышева, Ю.Г. Новая концепция аналитики в организации — бизнес-анализ // Учет и статистика. – 2019. – №. 2 (54). – С. 76-86

Темы

Раздел 1. Введение в большие данные. Тема 1.1 Введение в профессию Аналитик данных (Data Scientist). Тема 1.2 Базовое представление о Map Reduce Тема 1.3 Базовое представление о Hadoop Тема 1.4 Введение в язык программирования: Python. Обзор языка R Тема 1.5 Основы Python для работы с данными Тема 1.6 Работа с библиотеками Python: Pandas, Numpy, Scikit-learn, Matplotlib. Тема 1.7 Статистический и описательный анализ данных. Раздел 2. Технологии анализа данных. Тема 2.1 Аналитика больших данных Тема 2.2 Когнитивный анализ данных Тема 2.3 Прикладные инструменты анализа данных. Корреляция Тема 2.4 Методы анализа на графах Тема 2.5 EDA - разведочный анализ данных. Тема 2.6 BI-системы и визуализация данных Раздел 3. Работа с базами данных. Хранилища данных. Тема 3.1 Введение в Базы данных и теорию хранения данных. Тема 3.2 Язык SQL. Реляционные базы данных, использование SQL. Тема 3.3 Введение в DWH Тема 3.4 Распределенные базы данных NoSQL Тема 3.5 Введение в Озера данных (Data Lake)
Лекции
2,00ч
Практические занятия
2,00ч
Самостоятельная работа
1,00ч
Всего
5,00ч
Лекции
2,00ч
Практические занятия
4,00ч
Самостоятельная работа
1,00ч
Всего
7,00ч
Лекции
2,00ч
Практические занятия
4,00ч
Самостоятельная работа
2,00ч
Всего
8,00ч
Лекции
2,00ч
Практические занятия
2,00ч
Самостоятельная работа
2,00ч
Всего
6,00ч
Лекции
2,00ч
Практические занятия
2,00ч
Самостоятельная работа
1,00ч
Всего
5,00ч
Лекции
2,00ч
Практические занятия
6,00ч
Самостоятельная работа
2,00ч
Всего
10,00ч
Лекции
2,00ч
Практические занятия
4,00ч
Самостоятельная работа
1,00ч
Всего
7,00ч
Лекции
2,00ч
Практические занятия
4,00ч
Самостоятельная работа
2,00ч
Всего
8,00ч
Лекции
2,00ч
Практические занятия
4,00ч
Самостоятельная работа
1,00ч
Всего
7,00ч
Лекции
2,00ч
Практические занятия
4,00ч
Самостоятельная работа
1,00ч
Всего
7,00ч
Лекции
2,00ч
Практические занятия
4,00ч
Самостоятельная работа
1,00ч
Всего
7,00ч
Лекции
2,00ч
Практические занятия
4,00ч
Самостоятельная работа
1,00ч
Всего
7,00ч
Лекции
2,00ч
Практические занятия
4,00ч
Самостоятельная работа
2,00ч
Всего
8,00ч
Лекции
2,00ч
Практические занятия
4,00ч
Самостоятельная работа
2,00ч
Всего
8,00ч
Лекции
2,00ч
Практические занятия
6,00ч
Самостоятельная работа
2,00ч
Всего
10,00ч
Лекции
2,00ч
Самостоятельная работа
1,00ч
Всего
3,00ч
Лекции
2,00ч
Практические занятия
2,00ч
Самостоятельная работа
2,00ч
Всего
6,00ч
Лекции
2,00ч
Самостоятельная работа
1,00ч
Всего
3,00ч
Промежуточная аттестация 4,00 часа
Решение практико-ориентированных задач (кейсов).