Модуль 1
49,00ч

Введение в инженерию больших данных. Языки программирования (Python/C++)

Модуль ориентирован на введение в технологии DataScience и BigData для решения практических задач. Предусматривает изучение языков программирования Python и C++.
Вы научитесь программировать на Python и C++, работать с библиотеками Python
Часов в программе
13,00 часов
лекции
25,00 часов
практика
11,00 часов
самостоятельная
49,00 часов
всего
Материально-технические условия реализации программы:
Вид занятий: Лекционные занятия
Требуемое ПО:
веб-браузеры Google Chrome, Mozila Firefox, Opera, Microsoft Edge, Яндекс.Браузер и др.
Вид занятий: Практические занятия, самостоятельная работа
Требуемое ПО:
веб-браузеры Google Chrome, Mozila Firefox, Opera, Microsoft Edge, Яндекс.Браузер и др.
Anaconda 2.7 или 3.5
Доступ к облачным вычислительным ресурсам.
Информационные ресуры
1. https://ai.2035.university/ - сайт УНТИ 2035 «Обучение в области искусственного интеллекта»
2. https://xn--80aapampemcchfmo7a3c9ehj.xn--p1ai/projects/tsifrovaya-ekonomika - сайт Национального проекта «Цифровая экономика»
3. https://xn--80aapampemcchfmo7a3c9ehj.xn--p1ai/projects/tsifrovaya-ekonomika/p-iskusstvennyy-intellekt-p – сайт федерального проекта «Искусственный интеллект» Национального проекта «Цифровая экономика»
4. https://sprint.1t.ru/ - сайт образовательной платформы ООО «1Т»
5. https://trends.rbc.ru/trends/tag/ai - раздел «Искусственный интеллект» на сайте РБК.
6. https://www.tadviser.ru/index.php/%D0%9F%D1%80%D0%BE%D0%B4%D1%83%D0%BA%D1%82:%D0%98%D1%81%D0%BA%D1%83%D1%81%D1%81%D1%82%D0%B2%D0%B5%D0%BD%D0%BD%D1%8B%D0%B9_%D0%B8%D0%BD%D1%82%D0%B5%D0%BB%D0%BB%D0%B5%D0%BA%D1%82_(%D0%98%D0%98,_Artificial_intelligence,_AI) – раздел «Искусственный интеллект» на сайте «TAdviser». Государство. Бизнес. Технологии.
7. https://rb.ru/opinion/inzhener-dannyh/ - «Инженер данных: что это за специалист и как им стать?» на сайте - RB.RU
8. https://rb.ru/opinion/data-engineer-modeli-data-scientist/ - «В России катастрофически не хватает инженеров данных – кому и зачем они нужны» на сайте - RB.RU
Образовательные ресуры
1. Воронцов К. В. Машинное обучение: курс лекций // MachineLearning.ru. - URL: http://www.recognition.su/wiki/index.php?title=Машинное_обучение_(курс_лекций%2C_К.В.Воронцов).
2. Бесплатные материалы по Data Engineering от преподавателей МФТИ https://fpmi-edu.ru/free-de
3. https://ru.coursera.org/specializations/gcp-data-machine-learning#courses

Учебно-методические материалы

Методы, формы и технологии

Для достижения планируемых результатов обучение строится с использованием следующих:
методов: case-study, метод проектов, модульное обучение, проблемное обучение, контекстное обучение;
форм: лекции с использованием мультимедиа, практические занятия, самостоятельная работа, практика на базе привлекаемой организации.

Кроме того, обучение строится с применением технологий электронного обучения
и дистанционных образовательных технологий.

Методические разработки

Обучающие материалы дисциплины представлены в виде видеолекций, текстовых и графических материалов, размещенных на платформе 1T

Материалы курса

Видеолекции
Текстовые материалы лекций
Инструкции для выполнения заданий
Обучающие задания с автоматизированной системой проверки и подсказками
Проверочные задания с автоматизированной системой проверки

Учебная литература

1. Kuhn, M., & Johnson, K. (2019). Feature Engineering and Selection: A Practical Approach for Predictive Models (1st ed.). Chapman and Hall/CRC. https://doi.org/10.1201/9781315108230.
2. Дэви Силен, Арно Мейсман, Мохамед Али. Основы Data Science и Big Data. Python и наука о данных. – СПб.: Питер, 2017 – 336 с.: ил – (Серия «Библиотека программиста»). ISBN 978-5-496-02517-1.
3. Большие данные в социальных и гуманитарных науках: Сб. обзоров и рефератов / РАН. ИНИОН. Центр науч.-информ. исслед. по науке, образованию и технологиям; отв. ред. – Гребенщикова Е.Г. – М., 2019. – 193 с. – (Сер.: Наука, образование и технологии). ISBN 978-5-248-00912-1.
4. Радченко И.А, Николаев И.Н. Технологии и инфраструктура Big Data. – СПб: Университет ИТМО, 2018. – 52 с.
5. Коротеев М. В. Обзор некоторых современных тенденций в технологии машинного обучения // E-Managment. – 2018. – Т. 1, № 1. − С. 26-35. − DOI: 10.26425/2658-3445-2018-1-26-35.

Темы

Тема 1.1 Инженер данных. Цели, направления, задачи, обязанности и функция в команде Тема 1.2 Технологии DataScience и BigData для решения практических задач Тема 1.3 Основы синтаксиса и структур в Python Тема 1.4 Использование библиотек NumPy, SciPy для вычислений Тема 1.5 Обработка данных в Python. Библиотека Pandas Тема 1.6 Библиотеки Python для визуализации данных Тема 1.7 Синтаксис языка программирования С++
Лекции
1,00ч
Практические занятия
1,00ч
Самостоятельная работа
1,00ч
Всего
3,00ч
Лекции
2,00ч
Самостоятельная работа
2,00ч
Всего
4,00ч
Лекции
2,00ч
Практические занятия
4,00ч
Самостоятельная работа
2,00ч
Всего
8,00ч
Лекции
2,00ч
Практические занятия
4,00ч
Самостоятельная работа
2,00ч
Всего
8,00ч
Лекции
2,00ч
Практические занятия
6,00ч
Самостоятельная работа
1,00ч
Всего
9,00ч
Лекции
2,00ч
Практические занятия
4,00ч
Самостоятельная работа
1,00ч
Всего
7,00ч
Лекции
2,00ч
Практические занятия
6,00ч
Самостоятельная работа
2,00ч
Всего
10,00ч