Большие данные MapReduce Визуализировать данные Apache Hadoop Python NumPy Pandas Анализировать данные PostgreSQL

Анализ данных в Python

ГАУ "Технопарк в сфере высоких технологий "ИТ-парк"
250,00 часов длительность
Онлайн формат
Начальный уровень
1 поток (закрыт) 15.11.2021-30.04.2022

Описание

На этом курсе слушатели изучают важнейшие библиотеки и инструменты Python (Питон) для анализа данных (Data science).
Также на курсе рассматриваются средства Python для визуализации данных, извлечения данных из всемирной паутины, основы работы с СУБД PostgreSQL, машинного обучения и обработки текстовых документов и произведений на обычных языках.

Образовательный курс направлен на формирование и развитие у обучающегося компетенций в области "Большие данные" и включает в себя десять модуля:

Модуль 1. Основы Python - 22 ак.ч
Модуль 2. Структуры данных - 38 ак.ч
Модуль 3. Работа с текстом - 21 ак.ч
Модуль 4. Библиотека Pandas - 18 ак.ч
Модуль 5. Базы данных и SQL - 34 ак.ч
Модуль 6. Взаимодействие с базами данных в Python - 36 ак.ч
Модуль 7. Библиотека Numpy - 22 ак.ч
Модуль 8. Графики и визуализация - 21 ак.ч
Модуль 9. Основы машинного обучения - 38 ак.ч

Форма обучения - онлайн, с применением электронного обучения и дистанционных образовательных технологий  на образовательной платформе Moodle и прямые эфиры с преподавателем. 144 академических часа трудоёмкости учебной деятельности отведено практическим занятиям и выполнению практических заданий.

Часов в программе
75,00 часов
лекции
138,00 часов
практика
29,00 часов
самостоятельная
9,00 часов
промежуточная аттестация
1 час
входная диагностика
1 час
итоговая аттестация
253,00 часа
всего
Цель программы
Цель программы – изучить язык Python и научиться применять его для решения задач анализа данных и машинного обучения.
Актуальность
Всего за несколько лет средства анализа данных, доступные разработчикам на Python, совершили рывок вперёд. Появились мощные пакеты, реализующие алгоритмы машинного обучения, обработку естественных языков, статистический анализ и визуализацию.

Инструменты языка Python просты в использовании, при этом имеют широкие возможности применения. Программирование на Python – простой и эффективный вариант для вхождения в популярную сферу Data Science.

Уникальная особенность языка – возможность быстрого встраивания анализа данных в веб-приложения.
Входная диагностика 1 час
Диагностика на входе представляет собой входное тестирование с базовыми 10 вопросами по школьному курсу информатики, с целью определения уровня знаний потенциальных слушателей. Тестирование проводится с использованием единой информационной среды с электронными формами контроля и оценки у каждого слушателя есть три попытки на прохождение тестирования. Время на одну попытку - 30 минут.
Для зачисления необходимо верно ответить на 50% вопросов.
Итоговая аттестация 1 час
Контроль и оценка результатов освоения дисциплины осуществляется преподавателем в процессе проведения практических занятий и лабораторных работ, тестирования, а также выполнения обучающимися индивидуальных заданий, проектов, исследований.

Компетенции

Профессиональные


ОПК-2 -Способностью приобретать новые научные и профессиональные знания, используя современные образовательные и информационные технологии
Знать:

В результате освоения дисциплины студент должен знать:

- синтаксис и управляющие конструкции языка Python;
- основные стандартные модули и библиотеки в Python;
- особенности разработки прикладных программ на языке Python;
- принципы разработки собственных модулей и библиотек;
- специализированные библиотеки для анализа данных.

Уметь:

В результате освоения дисциплины студент должен уметь:

- разрабатывать прикладные программы на языке программирования Python;
- использовать как стандартные, так и дополнительные модули, расширения и пакеты;
- создавать собственные модули и импортировать их;
- создавать собственные приложения и библиотеки.

Владеть:

В результате освоения дисциплины студент должен владеть:

- навыками разработки приложений с внешними источниками данных (текстовыми файлами,
xml-файлами,
- практическими навыками использования набора библиотек языка Python для прикладных
задач в области
анализа данных;
- навыками разработки приложений и собственных библиотек на языке Python.

Требования

Нет

Образование
  • Высшее образование
  • Среднее профессиональное образование

Модули

свернуть
23,00ч
Модуль 1 Основы Python
1.1. Переменные 1.2. Преобразование типов данных: 1.3. Условия (конструкция IF) 1.4. Циклы (FOR, WHILE)
22,00ч
Модуль 3 Работа с текстом
3.1 Строки 3.2 Файлы
35,00ч
Модуль 5 Базы данных и SQL
5.1 Основы реляционной модели SQL 5.2 Запросы SQL к связанныt c таблицами 5.3 Базы данных и SQL запросы 5.4 SQL запросы пользователей
23,00ч
Модуль 7 Библиотека Numpy
7.1 Массивы Numpy 7.2 Операции над массивами Numpy
32,00ч
Модуль 9 Основы машинного обучения
9.1 Математические основы машинного обучения 9.2 Основы статистического анализа данных 9.3 Методы машинного обучения:
38,00ч
Модуль 2 Структуры данных
2.1. Списки 2.2. Словари
19,00ч
Модуль 4 Библиотека Pandas
Чтение и запись Excel и CSV файлов
37,00ч
Модуль 6 Взаимодействие с базами данных в Python
6.1 Выборка данных из баз данных 6.2 Запись данных в базы данных 6.3 Функции 6.4 Классы
22,00ч
Модуль 8 Графики и визуализация
8.1 Библиотека Matplotlib 8.2 Библиотека Seaborn 8.3 Библиотека Plotly
23,00ч
Модуль 1 Основы Python
1.1. Переменные 1.2. Преобразование типов данных: 1.3. Условия (конструкция IF) 1.4. Циклы (FOR, WHILE)
38,00ч
Модуль 2 Структуры данных
2.1. Списки 2.2. Словари
22,00ч
Модуль 3 Работа с текстом
3.1 Строки 3.2 Файлы
19,00ч
Модуль 4 Библиотека Pandas
Чтение и запись Excel и CSV файлов
35,00ч
Модуль 5 Базы данных и SQL
5.1 Основы реляционной модели SQL 5.2 Запросы SQL к связанныt c таблицами 5.3 Базы данных и SQL запросы 5.4 SQL запросы пользователей
37,00ч
Модуль 6 Взаимодействие с базами данных в Python
6.1 Выборка данных из баз данных 6.2 Запись данных в базы данных 6.3 Функции 6.4 Классы
23,00ч
Модуль 7 Библиотека Numpy
7.1 Массивы Numpy 7.2 Операции над массивами Numpy
22,00ч
Модуль 8 Графики и визуализация
8.1 Библиотека Matplotlib 8.2 Библиотека Seaborn 8.3 Библиотека Plotly
32,00ч
Модуль 9 Основы машинного обучения
9.1 Математические основы машинного обучения 9.2 Основы статистического анализа данных 9.3 Методы машинного обучения:

Преподаватели

Агамиров

Владимир Левонович

ГАУ "Технопарк в сфере высоких технологий "ИТ-парк"

Преподаватель

72 000 p
Авторизуйтесь чтобы записаться

Профстандарт

Специалист по большим данным

06.042

Ответственный за программу

It.academy@tatar.ru

+79969383028