III уровень

Аналитик данных

260 часов длительность
Онлайн формат
Продвинутый уровень
1 поток 03.06-02.09.2024
2 поток 02.09-25.11.2024

Описание

Программа повышения квалификации разработана с учетом потребностей обучающихся, которые хотят продолжить карьеру в IT в качестве аналитика данных. 

#аналитик_данных #искусственный_интеллект #большие_данные #Python #SQL

Курс включает изучение методов и инструментальных средств решения задач искусственного интеллекта. Вы научитесь анализировать данные с помощью сервисов аналитики и BI-инструментов, освоите Python и SQL. Программа нацелена на формирование навыков применения методов обработки и хранения больших данных современными инструментами, а также навыков применения методов математической статистики, машинного обучения, глубокого обучения и интеллектуального анализа данных для решения прикладных задач.

Программа построена по модульному принципу, предполагает изучение теоретического материала и практическую отработку полученных знаний.

Преимущества курса:

  • Можно осваивать параллельно с получением среднего профессионального образования или высшего образования, основной работой без отрыва от производства.
  • В основе – передовые и наиболее востребованные методы, приемы, технологии работы с большими данными.
  • Использование современного программного обеспечения.
  • Дистанционный формат, удобный график и темп обучения.
  • Персональное сопровождение и поддержка обучающихся.
  • Интерактивный формат подачи учебного материала.
Часов в программе
64 часа
лекции
118 часов
практика
61 час
самостоятельная
8 часов
промежуточная аттестация
1 час
входная диагностика
8 часов
итоговая аттестация
260 часов
всего
Цель программы
Получение обучающимися компетенций, необходимых для профессиональной деятельности аналитика данных для разработки и применения технологических решений в области искусственного интеллекта и в смежных областях.
Актуальность
Один из актуальных трендов развития экономики и общества на сегодняшний день – это цифровизация. Актуальность цифровой экономики обусловлена тем, что произошли качественные изменения в этих сферах.
С 2017 года началось активное стимулирование процессов цифровизации экономики, осуществляемое со стороны государства. Об этом свидетельствуют многочисленные принятые в данном периоде нормативно-правовые акты в данной сфере. Прежде всего, была создана Автономная некоммерческая организация «Цифровая экономика», а также принят Указ Президента РФ «О стратегии развития информационного общества в РФ на 2017–2030 годы». В 2018 году был разработан нацпроект «Цифровая экономика РФ», а в 2019 году принят план информатизации Министерства цифрового развития, связи и массовых коммуникаций РФ, что стало отправной точкой в области цифровизации экономики России. В дальнейшем, в 2020 году, цифровизация экономики была простимулирована пандемией коронавируса, которая сопровождалась вынужденным режимом самоизоляции граждан, что повлекло массовый переход на дистанционные формы взаимодействия, требующие цифровых технологий и соответствующей инфраструктуры. В этом же году цифровизация была объявлена национальной целью развития России.
Указом Президента Российской Федерации от 10 октября 2019 г. № 490 «О развитии искусственного интеллекта в Российской Федерации» утверждена Национальная стратегия развития искусственного интеллекта на период до 2030 года.
Стратегия является основным программным документом, направленным на развитие и внедрение отечественных решений, формирующих внедрение инноваций во все сферы экономической деятельности и повседневной жизни граждан.
В развитие Национальной стратегии утвержден федеральный проект «Искусственный интеллект» (ИИ) сроком реализации до конца 2024 года.
Федеральный проект «Искусственный интеллект» предусматривает повышение уровня обеспечения российского рынка технологий ИИ квалифицированными кадрами и уровня информированности населения о возможных сферах использования ИИ.
Новой мерой в 2022 году стал запуск дополнительного профессионального образования граждан в области ИИ, в котором одной из актуальных специальностей является аналитик данных.
Аналитики данных востребованы, например, в сфере экономики и финансов. Они исследуют рынок с помощью инструментов анализа данных и строят свой прогноз на основе результатов анализа. Кроме того, аналитик оценивает бизнес и приводит технические требования в соответствие с бизнес-проектами и целями.
Входная диагностика 1 час
Входная диагностика (вступительное испытание) проводится в тестовой форме
Итоговая аттестация 8 часов
Решение практико-ориентированных задач (кейсов)

Компетенции

Профессиональные


Способен классифицировать и идентифицировать задачи искусственного интеллекта, выбирать адекватные методы и инструментальные средства решения задач искусственного интеллекта
Знать:

− основные определения искусственного интеллекта и больших данных;
− понятие A/B-тестирования;
− особенности продуктовой аналитики.

Уметь:

− проводить аналитические и поисковые исследования по тематике информационных технологий, технологий больших данных;
− строить несколько моделей и выбирать лучшую модель на данных.

Владеть:

− методами и инструментальными средствами решения задач искусственного интеллекта;
− навыками расчета ключевых метрик роста продукта с помощью Python

Способен разрабатывать и применять методы машинного обучения для решения задач
Знать:

− существующие и перспективные методы и программный инструментарий технологий больших данных;
− математические основы машинного обучения (линейная алгебра, статистика, оптимизация).

Уметь:

− применять язык программирования Python и библиотеки при разработке решений на основе ИИ;
− осуществлять массово параллельную обработку и анализ данных;
− строить модели машинного обучения (регрессия, классификация, кластеризация, нейросети);
− оценивать результаты моделирования и определять критерии качества построенных моделей.

Владеть:

− методами разработки моделей машинного обучения и нейронных сетей

Способен использовать инструментальные средства для решения задач машинного обучения
Знать:

− основные конструкции языка Python, библиотеки;
− системы обработки и анализа больших массивов данных (Hadoop, ETL, Spark и др.);

Уметь:

− осуществлять парсинг интернет-данных;
− применять SQL базы данных для прикладных решений;
− производить расчет вероятностных показателей с использованием языка Python;
− разрабатывать модели машинного обучения для решения задач.

Владеть:

− навыками расчета статистических показателей с использованием языка Python;
− навыками создания нескольких таблиц в СУБД Postgres посредствам Dbeaver;
− навыками интеллектуального анализа данных с помощью языка программирования R;
− навыками обучения нейронных сетей с помощью PyTorch, TensorFlow и Keras;
− навыками расчета ключевых метрик роста продукта с помощью Python;
− навыками настраивания кластеров Apache Spark и Hive на Hadoop;
− владение инструментами инструменты Weka,RapidMiner, Knime, Orange IBM SPSS Modeler, Tableau и др.;
− использовать базы данных (MongoDB, Clickhouse и др.

Способен осуществлять сбор и подготовку данных для систем искусственного интеллекта
Знать:

− различия между машинным обучением, нейронными сетями, глубоким обучением и EDA;
− язык запросов к СУБД;
− основные ETL процессы и инструменты.

Уметь:

− осуществлять поиск и структурирование данных;
− осуществлять подготовку и разметку структурированных и неструктурированных данных для машинного обучения.

Владеть:

− навыками решения базовых аналитических кейсов с использованием инструментов визуализации;
− навыками поиска аномалий в данных, сегментации PCA, уменьшения размерности данных

Способен выполнять анализ больших данных
Знать:

− основы теории баз данных;
− принципы работы NoSQL баз данных;
− основные уровни представления данных;
− особенности организации СУБД в MPP-системе;
− основные типы данных в СУБД Postgres;
− особенности колоночного формата хранения данных;
− принципы построения дашбордов;
− основные понятия теории вероятности;
− основы комбинаторики.

Уметь:

− производить аналитику для интеллектуального отслеживания ресурсов/процессов;
− визуализировать анализируемые данные;
− применять методы анализа на графах;
− создавать собственные модели данных с использованием UML-диаграмм.

Владеть:

− навыками использования статистических методов исследования;
− математическими методами анализа данных;
− навыками интеллектуального анализа данных с помощью языка программирования R

Способен использовать одну или несколько сквозных цифровых субтехнологий искусственного интеллекта
Знать:

− представление о сквозных цифровых субтехнологиях искусственного интеллекта;

Уметь:

− осуществлять математическое и информационное моделирование;
− решать прикладные задачи и участвовать в реализации проектов в области сквозной цифровой субтехнологии «Компьютерное зрение».

Владеть:

− навыками использования предварительно обученных моделей для классификации изображений и других задач;
− навыками обучения нейронной сети Keras многоклассовой классификации изображений на малом количестве данных

Требования

Требования к уровню подготовленности, определяемому контрольно-измерительными материалами.

Обучающиеся должны обладать следующими знаниями, умениями и владеть навыками:

PYTHON:

  • Знание синтаксиса языка.
  • Понимание базовых структур данных.
  • Владение основами ООП (класс, объект).
  • Владение базовыми знаниями в алгоритмах (“О” большое и т.д.).

SQL:

  • Знание базового синтаксиса SQL.
  • Умение составлять подзапросы, временные таблицы.
  • Навык работы с оконными функциями.

ИНФРАСТРУКТУРА:

  • Навыки работы с Docker.
  • Знание базовых команд Linux.
  • Навыки работы с системами контроля версий Git.

АНАЛИТИКА:

  • Понимание основ математической статистики.
  • Понимание основ теории вероятностей.
  • Базовые знания в выборе необходимого метода визуализации данных.
Квалификация
К обучению на программе допускаются: предприниматели, работники и владельцы компаний IT-сектора, имеющие высшее образование или среднее профессиональное (либо получающие высшее или среднее профессиональное образование), а также мотивированные специалисты из других профессиональных сфер и студенты, обучающиеся в области информационных технологий, а также по иным специальностям, которые заинтересованы в получении новых компетенций по специальности «Аналитик данных».
Владение необходимыми профессиональными компетенциями
Требования к компетенциям, которыми должен обладать гражданин при поступлении на программу:
- Способен использовать и адаптировать существующие математические методы и системы программирования для разработки и реализации алгоритмов решения прикладных задач;
- Способен применять и модифицировать математические модели для решения задач в области профессиональной деятельности;
- Владеет широкой общей подготовкой (базовыми знаниями) для решения практических задач в области информационных систем и технологий;
- Способен использовать современные компьютерные технологии поиска информации для решения поставленной задачи, критического анализа этой информации и обоснования принятых идей и подходов к решению;
- Способен выбирать и оценивать способ реализации информационных систем и устройств (программно-, аппаратно- или программно-аппаратно-) для решения поставленной задачи.
Иные требования и рекомендации для обучения по программе

Требования к уровню подготовленности, определяемому контрольно-измерительными материалами.

Обучающиеся должны обладать следующими знаниями, умениями и владеть навыками:

PYTHON:

  • Знание синтаксиса языка.
  • Понимание базовых структур данных.
  • Владение основами ООП (класс, объект).
  • Владение базовыми знаниями в алгоритмах (“О” большое и т.д.).

SQL:

  • Знание базового синтаксиса SQL.
  • Умение составлять подзапросы, временные таблицы.
  • Навык работы с оконными функциями.

ИНФРАСТРУКТУРА:

  • Навыки работы с Docker.
  • Знание базовых команд Linux.
  • Навыки работы с системами контроля версий Git.

АНАЛИТИКА:

  • Понимание основ математической статистики.
  • Понимание основ теории вероятностей.
  • Базовые знания в выборе необходимого метода визуализации данных.

Модули

свернуть
119ч
Модуль 1 Базовый
Цель освоения модуля 1 – приобретение слушателями профессиональных компетенций в области анализа данных, инструментов, библиотек и технологий хранения и обработки больших данных.
132ч
Модуль 2 Профильный
Цель освоения модуля 2 – приобретение слушателями профессиональных компетенций в области математического моделирования, машинного обучения и оптимизации, глубокого обучения и нейронных сетей, продвижения продукта, бизнес-метрики.
119ч
Модуль 1 Базовый
Цель освоения модуля 1 – приобретение слушателями профессиональных компетенций в области анализа данных, инструментов, библиотек и технологий хранения и обработки больших данных.
132ч
Модуль 2 Профильный
Цель освоения модуля 2 – приобретение слушателями профессиональных компетенций в области математического моделирования, машинного обучения и оптимизации, глубокого обучения и нейронных сетей, продвижения продукта, бизнес-метрики.

Преподаватели

Борисов

Вадим Владимирович

Филиал НИУ «МЭИ» в г. Смоленске

Профессор кафедры вычислительной техники

Доктор технических наук

Профессор

Жукова

Людмила Вячеславовна

НИТУ МИСИС

Доцент кафедры «Магистерская школа информационных бизнес-систем»

Кандидат экономических наук

https://1t.ru/teacher-zhukova

Санников

Даниил Александрович

ПАО «Сбербанк»

Главный аналитик данных

Хусаинов

Наиль Шавкятович

ФГАОУ ВО «Южный федеральный университет»

Заведующий кафедрой Института компьютерных технологий и информационной безопасности

Кандидат технических наук

Королева

Диана Олеговна

НИУ ВШЭ

Заведующая лабораторией инноваций в образовании

Костин

Алексей Николаевич

Ведущий преподаватель по ИИ

https://1t.ru/teacher-kostin

Кропивный

Дмитрий Алексеевич

Ведущий аналитик данных

Зиновьев

Дмитрий Владимирович

Системный аналитик

Лашков

Дмитрий Юрьевич

Старший аналитик данных

Клавдеев

Александр Владимирович

Старший аналитик данных

Кулакова

Надежда Сергеевна

Старший аналитик данных

Шарапов

Никита Александрович

Аналитик-исследователь

Авторизуйтесь чтобы записаться

Профстандарт

Специалист по большим данным

06.042

Специальность

Аналитик данных (Data Scientist)

Ответственный за программу

data@1t.ru

+79993333307