III уровень Искусственный интеллект

Аналитик данных

Российский новый университет
250 часов длительность
Онлайн формат
Продвинутый уровень
1 поток (закрыт) 05.06-04.09.2023
2 поток (закрыт) 04.09-04.12.2023

Описание

Курс нацелен на получение компетенций, необходимых для профессиональной деятельности аналитика данных (Data Scientist) для разработки и применения технологических решений в области искусственного интеллекта и в смежных областях.

Курс включает изучение методов и инструментальных средств решения задач искусственного интеллекта. Вы научитесь анализировать данные с помощью сервисов аналитики и BI-инструментов, освоите Python и SQL. Станете незаменимым специалистом — и сможете помогать бизнесу принимать решения на основе данных. Программа нацелена на формирование навыков применения методов обработки и хранения больших данных современными инструментами, а также навыков применения методов математической статистики, машинного обучения, глубокого обучения и интеллектуального анализа данных для решения прикладных задач.

Программа повышения квалификации построена по модульному принципу, предполагает изучение теоретического материала и практическую отработку полученных знаний.

Для оценки уровня знаний вы выполните практические кейсы и пройдете тестирование.

Часов в программе
64 часа
лекции
118 часов
практика
53 часа
самостоятельная
8 часов
промежуточная аттестация
1 час
входная диагностика
6 часов
итоговая аттестация
250 часов
всего
Цель программы
Целью программы является получение слушателями компетенций для профессиональной деятельности специалиста (Аналитика данных) в области искусственного интеллекта и больших данных при реализации проектов и разработки новых решений на основе данных
Актуальность
Данные — очень важная информация для любой компании. По ним можно предсказать поведение клиентов, отследить спрос на определенный товар, улучшить сервис и повысить продажи. Обработка значений и показателей сформировала целую профессию — аналитик данных.
Профессия аналитик данных входит в топ самых востребованных профессий не только в России, но и в мире. Сегодня ни одна крупная компания не обходится без услуг аналитика, так как результаты работы этого специалиста помогают понять, насколько эффективно работает бизнес и в каком направлении его следует развивать. Опытных профессионалов пока действительно мало, а это лишь повышает ценность аналитиков данных на рынке труда.
Аналитик данных (или дата-аналитик) — это специалист, который собирает, обрабатывает, изучает и интерпретирует данные. Его работа помогает принимать решения в бизнесе, управлении и науке. Обычно такие специалисты работают в компаниях, которые практикуют data-driven подход — ориентируются на данные и их анализ при принятии решений.
Аналитик данных — важный участник бизнеса, потому что обеспечивает уверенность в принятии решений. Создавать новый продукт очень дорого, а ошибка при внедрении новой функции может стоить компании репутации и прибыли. Дата-аналитики проводят А/B-тесты и строят модели, чтобы проверить, как пользователи или клиенты реагируют на нововведения, и оценить перспективы того или иного проекта. Это дешевле и снижает риски бизнеса. Чтобы делать свою работу хорошо, аналитик должен видеть бизнес-процессы. Поэтому важно, чтобы он мог влиять на процесс принятия решения, основываясь на результатах своих исследований.
Хороший аналитик данных не просто математик с навыками программиста. Он понимает бизнес-процессы и хорошо знает продукт. Такой специалист разбирается, на чем зарабатывает конкретный бизнес. В результате его работы компания может получать больше прибыли и делать своих пользователей счастливее. Сильный аналитик данных прежде, чем взяться за работу, всегда спрашивает руководителя о том, какую задачу хочет решить бизнес.
Для каждого бизнеса задачи будут свои, а порядок действий общий.
Аналитик данных работает так:
— собирает данные (формирует запрос сам или получает задачу от менеджеров);
— знакомится с параметрами набора (какие типы данных собраны, как их можно отсортировать);
— проводит предварительную обработку (очищает от ошибок и повторов, упорядочивает);
— интерпретирует (анализирует, собственно, решает задачу);
— делает вывод;
— визуализирует (так, чтобы на основе вывода можно было принять решение, подтвердить или опровергнуть гипотезу).
Типичные задачи, с которыми приходят к дата-аналитику:
— Получить выгрузку данных для определенных целей
Бухгалтерии нужен список сотрудников, у которых в семье пятеро детей, — специалист делает выгрузку из базы данных.
— Ответить на вопрос бизнеса
Сделать расчет определенной метрики: сколько сотрудников уволилось до конца испытательного срока в этом году и сколько в предыдущем. Если компания вводит новую систему адаптации, то изменения такой метрики покажут результат.
— Провести А/B-тестирование
Нужно выяснить, как пользователи реагируют на то, какого цвета кнопка, зеленого или красного. Аналитик тестирует два прототипа. Часть пользователей видят прототип с зеленой кнопкой, другие — с красной. Он смотрит, как реагировали пользователи, проверяет, было ли различие статистически значимо. В итоге — рекомендует решение, которое проверил в ходе теста: внедрить зеленую или красную кнопку.
— Провести исследования
Конкретного вопроса от бизнеса нет, но нужен ресерч: взять внешние или внутренние данные, исследовать, найти аномалии или инсайты, провести пиар-исследование.
— Просчитать, какой вариант выгоднее
Юнит-экономика: расчет РОИ, инвестиционного потенциала. Оценить окупаемость рекламной кампании или скорректировать бизнес-модель.
— Выяснить, какой товар и в какое время больше покупают
Взять группу товаров и посмотреть, есть ли сезонные всплески интереса, сравнить с другими группами.
Статистика позволяет сделать общие выводы по конкретному вопросу. А аналитика данных — исследовать тему со всех сторон, сравнить решения, найти аномалии или инсайты, сопоставить события по множеству параметров. Это открывает новые возможности для бизнеса.
Дата-аналитик может исследовать внутренние данные компании или обратиться к внешним источникам. Анализ открытых данных позволяет отслеживать важные социальные и культурные тренды.
Входная диагностика 1 час
Входная диагностика (вступительное испытание) проводится в тестовой форме.
Итоговая аттестация 6 часов
Решение практико-ориентированных задач (кейсов)

Компетенции

Профессиональные


Способен классифицировать и идентифицировать задачи искусственного интеллекта, выбирать адекватные методы и инструментальные средства решения задач искусственного интеллекта
Знать:

− определения, история развития и главные тренды ИИ;
− основы планирования аналитических работ;
− стандарты жизненного цикла Big Data: CRISP-DM;
− методы моделирования данных;
− основы обеспечения информационной безопасности

Уметь:

− искать закономерности в результатах проведенных исследований;
− рассчитывать ключевые метрики работы компании и оценивать их значимость;
− проводить сравнительный анализ методов и инструментальных средств анализа больших данных;
− планировать аналитические работы с использованием технологий больших данных

Владеть:

− навыками оформления результаты аналитического исследования для представления заказчику.

Способен разрабатывать и применять методы машинного обучения для решения задач
Знать:

− основные термины и понятия машинного обучения

Уметь:

− запускать А/В-тестирования для проверки гипотез;
− решать практические задачи используя математическую статистику;
− решать задачи классификации, кластеризации, регрессии, прогнозирования, снижения размерности и ранжирования данных (деревья решений, RandomForest, k-means).

Владеть:

− навыками построения собственной небольшой модели линейной регрессии на основе библиотеки PyTorch.

Способен использовать инструментальные средства для решения задач машинного обучения
Знать:

− основные концепции Hadoop;
− язык python и его особенности, структуры данных python;
− способы анализа данных на языках программирования Python, R;
− методы Data Mining;
− введение в Базы данных и теорию хранения данных;
− принцип работы Наивного Байесовского классификатора

Уметь:

− произвести установку экосистемы Hadoop на виртуальную машину или использовать Docker;
− разрабатывать и оценивать модели больших данных.

Владеть:

− основными инструментами для работы с данными: Git, Docker, CI/CD, RestAPI;
− навыками работы с библиотеками Python;
− навыками работы с библиотеками Numpy, SciPy;
− инструментами визуализации: Tableau, Фреймворки на JS, D3;
− инструментом анализа данных Knime.

Способен осуществлять сбор и подготовку данных для систем искусственного интеллекта
Знать:

− теоретические и прикладные основы анализа больших данных;
− современные методы и инструментальные средства анализа больших данных;
− принципы моделирования данных в Data Warehouse;
− назначения Data Lake (озеро данных).

Уметь:

− автоматизировать процессы сбора и обработки данных для составления аналитических и статистических отчетов;
− выгружать, преобразовывать и очищать данные с помощью SQL-запросов.

Владеть:

− навыками использования реляционных баз данных SQL: GreenPlum, Postgres, Oracle;
− навыками использования Spark для запуска процессов ELT и аналитики данных с различных источников, структур и данных.

Способен выполнять анализ больших данных
Знать:

− базовую теорию вероятности и математическую статистику;
− технологии анализа данных: статистический анализ, семантический анализ, анализ изображений, машинное обучение, методы сравнения средних, частотный анализ, анализ соответствий, кластерный анализ, дискриминантный анализ, факторный анализ, деревья классификации, многомерное шкалирование, моделирование структурными уравнениями, методы анализа выживаемости, временные ряды, планирование экспериментов, карты контроля качества;
− стандарты проведения анализа данных.

Уметь:

− использовать математическую статистику при анализе данных;
− проводить математический и числовой анализ с помощью библиотек Numpy, Scikit-learn;
− проводить корреляционный анализ и регрессионный анализ данных;
− представлять содержание и результаты работ по анализу больших данных.

Владеть:

− навыками статистического и описательного анализа данных;
− навыками использования инструментов для проведения разведочного анализа данных.

Способен использовать одну или несколько сквозных цифровых субтехнологий искусственного интеллекта
Знать:

− векторное представление слов, мешок слов и N-граммы, TF-IDF, эмбендинги

Уметь:

− проводить анализ естественного языка с помощью методов искусственного интеллекта

Владеть:

− навыками использование NLP-алгоритмов для анализа текста

Требования

Слушатели должны обладать следующими знаниями, умениями и владеть навыками:

Владение базовыми навыками программирования

PYTHON
● Знание синтаксиса языка
● Понимание базовых структур данных
● Владение основами ООП (класс, объект)

 SQL
● Знание базовых команд
● Умение заполнять и объединять таблицы 
● Навык работы с оконными функциями и временными таблицами

ИНФРАСТРУКТУРА
● Умение работать с командной строкой
● Навыки работы с системами контроля версий Git

МАТЕМАТИЧЕСКАЯ СТАТИСТИКА
● Знание базовых основ описательной статистики
● Понимание регрессии и регрессионного анализа
● Проверка гипотез и подбор уровня статистической значимости

Образование
  • Высшее образование
  • Среднее профессиональное образование
Квалификация
Программа рассчитана на специалистов IT-организаций с высшим или средним профессиональным образованием, а также работников из других профессиональных областей, желающих получить новые компетенции по специальности «Аналитик данных».
Также к обучению допускаются студенты высших и средних профессиональных образовательных организаций.
Опыт профессиональной дятельности
Желателен опыт практической деятельности в системном анализе.
Иные требования и рекомендации для обучения по программе

Слушатели должны обладать следующими знаниями, умениями и владеть навыками:

Владение базовыми навыками программирования

PYTHON
● Знание синтаксиса языка
● Понимание базовых структур данных
● Владение основами ООП (класс, объект)

 SQL
● Знание базовых команд
● Умение заполнять и объединять таблицы 
● Навык работы с оконными функциями и временными таблицами

ИНФРАСТРУКТУРА
● Умение работать с командной строкой
● Навыки работы с системами контроля версий Git

МАТЕМАТИЧЕСКАЯ СТАТИСТИКА
● Знание базовых основ описательной статистики
● Понимание регрессии и регрессионного анализа
● Проверка гипотез и подбор уровня статистической значимости

Модули

свернуть
126ч
Модуль 1 МОДУЛЬ 1. ОСНОВНОЙ
Модуль предполагает введение в аналитику больших данных, технологии анализа данных, а также изучение основ работы с базами данных. Отдельные темы посвящены Map Reduce, Hadoop; основам Рython и его особенностям; платформам: Jupyter notebook, kaggle, Nvidia Cuda, средам разработки: VS, IntelliJIdea; математическому и числовому анализу с помощью библиотек Numpy, Scikit-learn, практическому применению библиотек. Будут изучены методы статистического и описательного анализа данных; способы анализа данных в R, введение в Data Mining; готовые комплексные решения анализа данных, EDA. Будут рассмотрены BI-системы и визуализация данных; основы языка SQL и реляционные базы данных, базы данных NoSQL; Data Lake
117ч
Модуль 2 МОДУЛЬ 2. ПРОФИЛИРУЮЩИЙ
Модуль предполагает введение в основы машинного обучения и нейронных сетей. Отдельные темы посвящены знакомству с ML, работе с Numpy, принципам работы классических моделей ML, обучению с учителем и без, временным рядам, развертыванию модели ML в производство. Будут рассмотрены виды нейронных сетей, способы обработки изображений с помощью нейронных сетей, способы обработки языковых представлений с помощью нейронных сетей, RL-обучение нейронных сетей с помощью взаимодействия со средой, обучение с подкреплением.
126ч
Модуль 1 МОДУЛЬ 1. ОСНОВНОЙ
Модуль предполагает введение в аналитику больших данных, технологии анализа данных, а также изучение основ работы с базами данных. Отдельные темы посвящены Map Reduce, Hadoop; основам Рython и его особенностям; платформам: Jupyter notebook, kaggle, Nvidia Cuda, средам разработки: VS, IntelliJIdea; математическому и числовому анализу с помощью библиотек Numpy, Scikit-learn, практическому применению библиотек. Будут изучены методы статистического и описательного анализа данных; способы анализа данных в R, введение в Data Mining; готовые комплексные решения анализа данных, EDA. Будут рассмотрены BI-системы и визуализация данных; основы языка SQL и реляционные базы данных, базы данных NoSQL; Data Lake
117ч
Модуль 2 МОДУЛЬ 2. ПРОФИЛИРУЮЩИЙ
Модуль предполагает введение в основы машинного обучения и нейронных сетей. Отдельные темы посвящены знакомству с ML, работе с Numpy, принципам работы классических моделей ML, обучению с учителем и без, временным рядам, развертыванию модели ML в производство. Будут рассмотрены виды нейронных сетей, способы обработки изображений с помощью нейронных сетей, способы обработки языковых представлений с помощью нейронных сетей, RL-обучение нейронных сетей с помощью взаимодействия со средой, обучение с подкреплением.

Преподаватели

Белоглазов

Александр Анатольевич

ФГБОУ ВО “Московский государственный гуманитарно-экономический университет”

Доцент кафедры информационных технологий и прикладной математики

Кандидат технических наук

Доцент

Золотарев

Олег Васильевич

Российский новый университет

Заведующий кафедрой «Информационные системы в экономике и управлении»

Кандидат технических наук

Доцент

http://professor.rosnou.ru/?q=taxonomy/term/114

Палкин

Евгений Алексеевич

Российский новый университет

Проректор по научно-инновационной работе, почетный работник высшего профессионального образования Российской Федерации, лауреат Государственной премии СССР

Кандидат физико-математических наук

Профессор

https://clck.ru/33uZcB

Растягаев

Дмитрий Владимирович

Российский новый университет

Проректор по информационным технологиям, доцент кафедры «Телекоммуникационные и информационные системы и средства связи»

Кандидат физико-математических наук

Доцент

http://professor.rosnou.ru/?q=node/71

Смолина

Светлана Георгиевна

Российский новый университет

Доцент кафедры «Информационные технологии и естественно-научные дисциплины»

Кандидат технических наук

Доцент

Авторизуйтесь чтобы записаться

Профстандарт

Специалист по большим данным

06.042

Специальность

Аналитик данных (Data Scientist)

Ответственный за программу

ai@rosnou.ru

+78006003180