III уровень

Аналитик данных

Финансовый университет при Правительстве Российской Федерации
256 часов длительность
Онлайн формат
1 поток (закрыт) 14.09-15.12.2022
2 поток (закрыт) 04.10-20.12.2022
Часов в программе
62 часа
лекции
91 час
практика
83 часа
самостоятельная
10 часов
промежуточная аттестация
10 часов
итоговая аттестация
256 часов
всего
Цель программы
Целью подготовки слушателей по Программе является получение компетенции, необходимой для выполнения нового вида профессиональной̆ деятельности в области информационных технологий обучающихся по специальностям и направлениям подготовки, отнесенным к ИТ; подготовка специалистов в области машинного обучения и анализа больших данных, приобретение новой квалификации – аналитик данных (искусственный интеллект).
В ходе освоения Программы Слушателем приобретаются следующие профессиональные компетенции:
- ПК 1. Способен анализировать большие данные с использованием существующей в организации методологической и технологической инфраструктуры
В ходе освоения Программы Слушателем совершенствуются следующие профессиональные компетенции:
- ПК-1. Применяет стандарты и методики бизнес-моделирования
- ПК-2. Осуществляет сбор и подготовку данных для обучения моделей искусственного интеллекта
- ПК-3. Использует большие данные
- ПК-4. Применяет языки программирования для решения профессиональных задач - Python и SQL
- ПК-5. Применяет СУБД
Итоговая аттестация 10 часов
Экзамен в форме тестирования и решение задачи

Требования

Иных требований нет

Образование
  • Высшее образование
  • Среднее профессиональное образование
Квалификация
Знание математики информатики
Опыт профессиональной дятельности
Опыт профессиональной деятельности не требуется
Предварительное освоение иных дисциплин/курсов /модулей
Предварителное освоение не требуется
Владение необходимыми профессиональными компетенциями
Владение базовыми навыками программирования
Иные требования и рекомендации для обучения по программе

Иных требований нет

Модули

свернуть
36ч
Модуль 1 Введение в аналитику данных
Цель модуля: предоставление знаний по новой профессии «Аналитик (данных)»: область деятельности, необходимые хард и софт скилы, обзора языковых, программных, инструментальных средств аналитики данных и методик обнаружения новых знаний, работа с большими данными, предоставление понимания методов моделирования бизнес- процессов, теории вероятности и математическая статистика в аналитике данных, приобретение слушателями компетенций по бизнес-анализу: предиктивной аналитике, предписывающему анализу. Профессиональные компетенции, совершенствуемые и приобретаемые слушателями в процессе освоения модуля 1:  ПК-1. Применяет стандарты и методики бизнес-моделирования.  ПК-2. Осуществляет сбор и подготовку данных для обучения моде-лей искусственного интеллекта. По итогам освоения модуля слушатели должны: Знать:  область деятельности и необходимые хард и софт скилы профессии «Аналитик (данных)»;  основные понятия и методы моделирования бизнес- процессов;  о статистическом анализе: о методе многовариантного тестирования, корреляционном анализе, регрессионном анализе;  о статистических методах: параметрические, непараметрические, управляемые, неуправляемые, полууправляемые, кластеризация;  об алгоритмах машинного обучения: обучение с учителем, обучение без учителя, полууправляемое обучение, обучение с подкреплением;  о машинном обучении: классификация, кластеризация, обнаружение выбросов, фильтрация;  о современных языках запросов;  об источниках информации, в том числе информации, необходимой для обеспечения деятельности в предметной области заказчика исследования; Уметь:  проводить сравнительный анализ методов и инструментальных средств анализа больших данных;  планировать аналитические работы с использованием технологий больших данных; Владеть:  навыками использования инструментов бизнес-анализа: предиктивной аналитике, предписывающему анализу.
54ч
Модуль 3 Языковые средства для аналитики данных
Цель модуля: приобретение слушателями знаний по современным языкам запросов, приобрести умения работы со построению запросов SQL, а также овладеть навыками работы с большими данных с использованием SQL. В результате освоения модуля слушатели должны: а) знать: - cовременные языки запросов - источники информации, в том числе информации, необходимой для обеспечения деятельности в предметной области заказчика исследования - типы больших данных: метаданные, полуструктурированные, структурированные, неструктурированные - виды источников данных: созданные человеком, созданные машинами б) уметь: - применять язык SQL для работы со построению запросов, сбора и подготовки данных и визуализации данных; - собирать, классифицировать, систематизировать и обеспечивать хранение и актуализацию информации бизнес-анализа; - использовать современные информационные технологии аналитики для информационно-аналитического сопровождения деятельности организации; в) владеть: - анализом решений с точки зрения достижения целевых показателей решений; - навыками работы с сырыми данными, использования SQL для интеграции и очистки данных; - навыками применения технологий машинного обучения для решения анализа данных и принятия решений.
60ч
Модуль 5 Инструментальные средства для аналитики данных и визуализации
Цель модуля: приобретение слушателями знаний по современным BI системам для выработки возможных решений посредством сбора и анализа больших данных и элементами информации бизнес-анализа, умения работы и овладевание навыками работы по визуализации анализа данных. . Профессиональные компетенции, совершенствуемые и приобретаемые слушателями в процессе освоения модуля 1:  ПК-1. Применяет стандарты и методики бизнес-моделирования.  ПК-2. Осуществляет сбор и подготовку данных для обучения моде-лей искусственного интеллекта. В результате освоения модуля слушатели должны: а) знать: - теоретические основы анализа данных, технология OLAP и Data Mining; - методику KDD (Knowledge Discovery in Databases), используемую при разработке моделей и решении стандартных задач Data Mining. - правила и методы проектирования моделей данных, внедрения анали-тических отчетов, информационных панелей мониторинга в компоненты ИТ инфраструктуры организации; - алгоритмические и программные методы проведения и интеллектуаль-ного анализа данных для принятия взвешенных решений; б) уметь: - решать задачи профессиональной деятельности, используя OLAP тех-нологии аналитики; - использовать современные информационные технологии аналитики для информационно-аналитического сопровождения деятельности; - работать с многомерными моделями в) владеть: - инструментами и технологиями выявления, сбора и анализа информации бизнес-анализа для формирования возможных решений; - инструментами формирования аналитических отчетов, дашбордов и «повествований» для поддержки принятия решений.
60ч
Модуль 2 Технологии хранения и обработки данных
Цель модуля: приобретение слушателями знаний по современным технологиям хранения и обработки данных, приобрести умения работы со статистическими методами анализа и обработки данных, а также овладеть навыками обработки данных с использованием табличных процессоров. Профессиональные компетенции, совершенствуемые и приобретаемые слушателями в процессе освоения модуля 2:  ПК-1. Применяет стандарты и методики бизнес-моделирования.  ПК-2. Осуществляет сбор и подготовку данных для обучения моде-лей искусственного интеллекта. По итогам освоения модуля слушатели должны: Знать:  Технологии хранения и обработки больших данных в организации: базы данных, хранилища данных, распределенная и параллельная обработка данных, вычисления в оперативной̆ памяти  Статистический анализ: метод многовариантного тестирования, корреляционный анализ, регрессионный анализ  Статистические методы: параметрические, непараметрические, управляемые, неуправляемые, полууправляемые, кластеризация. Алгоритмы машинного обучения: обучение с учителем, обучение без учителя, полууправляемое обучение, обучение с подкреплением. Машинное обучение: классификация, кластеризация, обнаружение выбросов, фильтрация Уметь:  Использовать технологии хранения и обработки больших данных в организации: базы данных, хранилища данных, распределенная и параллель-ная обработка данных, вычисления в оперативной̆ памяти;  Проводить сравнительный анализ методов и инструментальных средств анализа больших данных  Планировать аналитические работы с использованием технологий больших данных  Проводить анализ больших данных  Осуществлять интеграцию и преобразование данных в ходе работ по анализу больших данных  Владеть:  Навыками использования технологии хранения и обработки больших данных в организации: базы данных, хранилища данных, распределенная и параллельная обработка данных, вычисления в оперативной памяти Использования технологии анализа данных: статистический анализ, семантический анализ, анализ изображений, машинное обучение, методы сравнения средних, частотный анализ, анализ соответствий, кластерный анализ, дискриминантный анализ, факторный анализ, деревья классификации, много-мерное шкалирование, моделирование структурными уравнениями, методы анализа выживаемости, временные ряды, планирование экспериментов, карты контроля качества
36ч
Модуль 4 Использование языка Python для анализа данных
Цель модуля: приобретение слушателями знаний по конструкциям языка Python, приобрести умения работы со Python и SQL, а также овладеть навыками работы с Python для анализа данных. В результате освоения модуля слушатели должны: а) знать: типы данных и базовые алгоритмические конструкции в Python, средства языка для работы с массивами и строками, ввода/вывода данных через консоль и текстовые файлы, базовые понятия ООП и принципы их использования, способы реализации механизмов ООП в Python, принципы создания приложений с графическим интерфейсом, назначение и возможности библиотеки Pygame, основные понятия и базовые алгоритмы в области анализа данных и машинного обучения, назначение и возможности библиотек Pandas, SEABORN, PlotLy, NumPy и Matplotlib; б) уметь: использовать интегрированную среду разработки для написания и отладки программного кода на языке Python, описывать классы и иерархию связей между ними, реализовывать механизмы перегрузки операторов, документировать классы, инсталлировать и подключать к проекту библиотеки, использовать структуры данных и методы библиотек Pygame, Pandas, SEABORN, PlotLy, NumPy и Matplotlib; в) владеть: навыками работы в интегрированной среде разработки для Python, разработки программ с использованием механизмов ООП, навыками разработки графического интерфейса пользователя, навыками решения простейших задач классификации и анализа данных на языке Python.
36ч
Модуль 1 Введение в аналитику данных
Цель модуля: предоставление знаний по новой профессии «Аналитик (данных)»: область деятельности, необходимые хард и софт скилы, обзора языковых, программных, инструментальных средств аналитики данных и методик обнаружения новых знаний, работа с большими данными, предоставление понимания методов моделирования бизнес- процессов, теории вероятности и математическая статистика в аналитике данных, приобретение слушателями компетенций по бизнес-анализу: предиктивной аналитике, предписывающему анализу. Профессиональные компетенции, совершенствуемые и приобретаемые слушателями в процессе освоения модуля 1:  ПК-1. Применяет стандарты и методики бизнес-моделирования.  ПК-2. Осуществляет сбор и подготовку данных для обучения моде-лей искусственного интеллекта. По итогам освоения модуля слушатели должны: Знать:  область деятельности и необходимые хард и софт скилы профессии «Аналитик (данных)»;  основные понятия и методы моделирования бизнес- процессов;  о статистическом анализе: о методе многовариантного тестирования, корреляционном анализе, регрессионном анализе;  о статистических методах: параметрические, непараметрические, управляемые, неуправляемые, полууправляемые, кластеризация;  об алгоритмах машинного обучения: обучение с учителем, обучение без учителя, полууправляемое обучение, обучение с подкреплением;  о машинном обучении: классификация, кластеризация, обнаружение выбросов, фильтрация;  о современных языках запросов;  об источниках информации, в том числе информации, необходимой для обеспечения деятельности в предметной области заказчика исследования; Уметь:  проводить сравнительный анализ методов и инструментальных средств анализа больших данных;  планировать аналитические работы с использованием технологий больших данных; Владеть:  навыками использования инструментов бизнес-анализа: предиктивной аналитике, предписывающему анализу.
60ч
Модуль 2 Технологии хранения и обработки данных
Цель модуля: приобретение слушателями знаний по современным технологиям хранения и обработки данных, приобрести умения работы со статистическими методами анализа и обработки данных, а также овладеть навыками обработки данных с использованием табличных процессоров. Профессиональные компетенции, совершенствуемые и приобретаемые слушателями в процессе освоения модуля 2:  ПК-1. Применяет стандарты и методики бизнес-моделирования.  ПК-2. Осуществляет сбор и подготовку данных для обучения моде-лей искусственного интеллекта. По итогам освоения модуля слушатели должны: Знать:  Технологии хранения и обработки больших данных в организации: базы данных, хранилища данных, распределенная и параллельная обработка данных, вычисления в оперативной̆ памяти  Статистический анализ: метод многовариантного тестирования, корреляционный анализ, регрессионный анализ  Статистические методы: параметрические, непараметрические, управляемые, неуправляемые, полууправляемые, кластеризация. Алгоритмы машинного обучения: обучение с учителем, обучение без учителя, полууправляемое обучение, обучение с подкреплением. Машинное обучение: классификация, кластеризация, обнаружение выбросов, фильтрация Уметь:  Использовать технологии хранения и обработки больших данных в организации: базы данных, хранилища данных, распределенная и параллель-ная обработка данных, вычисления в оперативной̆ памяти;  Проводить сравнительный анализ методов и инструментальных средств анализа больших данных  Планировать аналитические работы с использованием технологий больших данных  Проводить анализ больших данных  Осуществлять интеграцию и преобразование данных в ходе работ по анализу больших данных  Владеть:  Навыками использования технологии хранения и обработки больших данных в организации: базы данных, хранилища данных, распределенная и параллельная обработка данных, вычисления в оперативной памяти Использования технологии анализа данных: статистический анализ, семантический анализ, анализ изображений, машинное обучение, методы сравнения средних, частотный анализ, анализ соответствий, кластерный анализ, дискриминантный анализ, факторный анализ, деревья классификации, много-мерное шкалирование, моделирование структурными уравнениями, методы анализа выживаемости, временные ряды, планирование экспериментов, карты контроля качества
54ч
Модуль 3 Языковые средства для аналитики данных
Цель модуля: приобретение слушателями знаний по современным языкам запросов, приобрести умения работы со построению запросов SQL, а также овладеть навыками работы с большими данных с использованием SQL. В результате освоения модуля слушатели должны: а) знать: - cовременные языки запросов - источники информации, в том числе информации, необходимой для обеспечения деятельности в предметной области заказчика исследования - типы больших данных: метаданные, полуструктурированные, структурированные, неструктурированные - виды источников данных: созданные человеком, созданные машинами б) уметь: - применять язык SQL для работы со построению запросов, сбора и подготовки данных и визуализации данных; - собирать, классифицировать, систематизировать и обеспечивать хранение и актуализацию информации бизнес-анализа; - использовать современные информационные технологии аналитики для информационно-аналитического сопровождения деятельности организации; в) владеть: - анализом решений с точки зрения достижения целевых показателей решений; - навыками работы с сырыми данными, использования SQL для интеграции и очистки данных; - навыками применения технологий машинного обучения для решения анализа данных и принятия решений.
36ч
Модуль 4 Использование языка Python для анализа данных
Цель модуля: приобретение слушателями знаний по конструкциям языка Python, приобрести умения работы со Python и SQL, а также овладеть навыками работы с Python для анализа данных. В результате освоения модуля слушатели должны: а) знать: типы данных и базовые алгоритмические конструкции в Python, средства языка для работы с массивами и строками, ввода/вывода данных через консоль и текстовые файлы, базовые понятия ООП и принципы их использования, способы реализации механизмов ООП в Python, принципы создания приложений с графическим интерфейсом, назначение и возможности библиотеки Pygame, основные понятия и базовые алгоритмы в области анализа данных и машинного обучения, назначение и возможности библиотек Pandas, SEABORN, PlotLy, NumPy и Matplotlib; б) уметь: использовать интегрированную среду разработки для написания и отладки программного кода на языке Python, описывать классы и иерархию связей между ними, реализовывать механизмы перегрузки операторов, документировать классы, инсталлировать и подключать к проекту библиотеки, использовать структуры данных и методы библиотек Pygame, Pandas, SEABORN, PlotLy, NumPy и Matplotlib; в) владеть: навыками работы в интегрированной среде разработки для Python, разработки программ с использованием механизмов ООП, навыками разработки графического интерфейса пользователя, навыками решения простейших задач классификации и анализа данных на языке Python.
60ч
Модуль 5 Инструментальные средства для аналитики данных и визуализации
Цель модуля: приобретение слушателями знаний по современным BI системам для выработки возможных решений посредством сбора и анализа больших данных и элементами информации бизнес-анализа, умения работы и овладевание навыками работы по визуализации анализа данных. . Профессиональные компетенции, совершенствуемые и приобретаемые слушателями в процессе освоения модуля 1:  ПК-1. Применяет стандарты и методики бизнес-моделирования.  ПК-2. Осуществляет сбор и подготовку данных для обучения моде-лей искусственного интеллекта. В результате освоения модуля слушатели должны: а) знать: - теоретические основы анализа данных, технология OLAP и Data Mining; - методику KDD (Knowledge Discovery in Databases), используемую при разработке моделей и решении стандартных задач Data Mining. - правила и методы проектирования моделей данных, внедрения анали-тических отчетов, информационных панелей мониторинга в компоненты ИТ инфраструктуры организации; - алгоритмические и программные методы проведения и интеллектуаль-ного анализа данных для принятия взвешенных решений; б) уметь: - решать задачи профессиональной деятельности, используя OLAP тех-нологии аналитики; - использовать современные информационные технологии аналитики для информационно-аналитического сопровождения деятельности; - работать с многомерными моделями в) владеть: - инструментами и технологиями выявления, сбора и анализа информации бизнес-анализа для формирования возможных решений; - инструментами формирования аналитических отчетов, дашбордов и «повествований» для поддержки принятия решений.

Преподаватели

Мещеряков

Роман Валерьевич

Институт проблем управления им. В.А. Трапезникова Российиской академии наук

Главный научный сотрудник, заведующий лабораторией киберфизических систем, директор центра Интеллектуальных робототехнических систем

Доктор технических наук

Профессор

Захарова (Гельгорн)

Алёна Александровна

Институт проблем управления им. В.А. Трапезникова (ИПУ РАН)

главный научный сотрудник лаборатории "Киберфизических систем"

Доктор технических наук

Профессор

Авторизуйтесь чтобы записаться

Профстандарт

06.042

Специальность

Аналитик данных (Data Scientist)

Ответственный за программу

defu@fa.ru

+79855575583