Аналитик данных
1ТОписание
Программа повышения квалификации разработана с учетом потребностей обучающихся, которые хотят продолжить карьеру в IT в качестве аналитика данных.
#аналитик_данных #искусственный_интеллект #большие_данные #Python #SQL
Курс включает изучение методов и инструментальных средств решения задач искусственного интеллекта. Вы научитесь анализировать данные с помощью сервисов аналитики и BI-инструментов, освоите Python и SQL. Программа нацелена на формирование навыков применения методов обработки и хранения больших данных современными инструментами, а также навыков применения методов математической статистики, машинного обучения, глубокого обучения и интеллектуального анализа данных для решения прикладных задач.
Программа построена по модульному принципу, предполагает изучение теоретического материала и практическую отработку полученных знаний.
Преимущества курса:
- Можно осваивать параллельно с получением среднего профессионального образования или высшего образования, основной работой без отрыва от производства.
- В основе – передовые и наиболее востребованные методы, приемы, технологии работы с большими данными.
- Использование современного программного обеспечения.
- Дистанционный формат, удобный график и темп обучения.
- Персональное сопровождение и поддержка обучающихся.
- Интерактивный формат подачи учебного материала.
Часов в программе
Цель программы
Актуальность
С 2017 года началось активное стимулирование процессов цифровизации экономики, осуществляемое со стороны государства. Об этом свидетельствуют многочисленные принятые в данном периоде нормативно-правовые акты в данной сфере. Прежде всего, была создана Автономная некоммерческая организация «Цифровая экономика», а также принят Указ Президента РФ «О стратегии развития информационного общества в РФ на 2017–2030 годы». В 2018 году был разработан нацпроект «Цифровая экономика РФ», а в 2019 году принят план информатизации Министерства цифрового развития, связи и массовых коммуникаций РФ, что стало отправной точкой в области цифровизации экономики России. В дальнейшем, в 2020 году, цифровизация экономики была простимулирована пандемией коронавируса, которая сопровождалась вынужденным режимом самоизоляции граждан, что повлекло массовый переход на дистанционные формы взаимодействия, требующие цифровых технологий и соответствующей инфраструктуры. В этом же году цифровизация была объявлена национальной целью развития России.
Указом Президента Российской Федерации от 10 октября 2019 г. № 490 «О развитии искусственного интеллекта в Российской Федерации» утверждена Национальная стратегия развития искусственного интеллекта на период до 2030 года.
Стратегия является основным программным документом, направленным на развитие и внедрение отечественных решений, формирующих внедрение инноваций во все сферы экономической деятельности и повседневной жизни граждан.
В развитие Национальной стратегии утвержден федеральный проект «Искусственный интеллект» (ИИ) сроком реализации до конца 2024 года.
Федеральный проект «Искусственный интеллект» предусматривает повышение уровня обеспечения российского рынка технологий ИИ квалифицированными кадрами и уровня информированности населения о возможных сферах использования ИИ.
Новой мерой в 2022 году стал запуск дополнительного профессионального образования граждан в области ИИ, в котором одной из актуальных специальностей является аналитик данных.
Аналитики данных востребованы, например, в сфере экономики и финансов. Они исследуют рынок с помощью инструментов анализа данных и строят свой прогноз на основе результатов анализа. Кроме того, аналитик оценивает бизнес и приводит технические требования в соответствие с бизнес-проектами и целями.
Входная диагностика 1 час
Итоговая аттестация 8 часов
Компетенции
Профессиональные
Способен классифицировать и идентифицировать задачи искусственного интеллекта, выбирать адекватные методы и инструментальные средства решения задач искусственного интеллекта
− основные определения искусственного интеллекта и больших данных;
− понятие A/B-тестирования;
− особенности продуктовой аналитики.
− проводить аналитические и поисковые исследования по тематике информационных технологий, технологий больших данных;
− строить несколько моделей и выбирать лучшую модель на данных.
− методами и инструментальными средствами решения задач искусственного интеллекта;
− навыками расчета ключевых метрик роста продукта с помощью Python
Способен разрабатывать и применять методы машинного обучения для решения задач
− существующие и перспективные методы и программный инструментарий технологий больших данных;
− математические основы машинного обучения (линейная алгебра, статистика, оптимизация).
− применять язык программирования Python и библиотеки при разработке решений на основе ИИ;
− осуществлять массово параллельную обработку и анализ данных;
− строить модели машинного обучения (регрессия, классификация, кластеризация, нейросети);
− оценивать результаты моделирования и определять критерии качества построенных моделей.
− методами разработки моделей машинного обучения и нейронных сетей
Способен использовать инструментальные средства для решения задач машинного обучения
− основные конструкции языка Python, библиотеки;
− системы обработки и анализа больших массивов данных (Hadoop, ETL, Spark и др.);
− осуществлять парсинг интернет-данных;
− применять SQL базы данных для прикладных решений;
− производить расчет вероятностных показателей с использованием языка Python;
− разрабатывать модели машинного обучения для решения задач.
− навыками расчета статистических показателей с использованием языка Python;
− навыками создания нескольких таблиц в СУБД Postgres посредствам Dbeaver;
− навыками интеллектуального анализа данных с помощью языка программирования R;
− навыками обучения нейронных сетей с помощью PyTorch, TensorFlow и Keras;
− навыками расчета ключевых метрик роста продукта с помощью Python;
− навыками настраивания кластеров Apache Spark и Hive на Hadoop;
− владение инструментами инструменты Weka,RapidMiner, Knime, Orange IBM SPSS Modeler, Tableau и др.;
− использовать базы данных (MongoDB, Clickhouse и др.
Способен осуществлять сбор и подготовку данных для систем искусственного интеллекта
− различия между машинным обучением, нейронными сетями, глубоким обучением и EDA;
− язык запросов к СУБД;
− основные ETL процессы и инструменты.
− осуществлять поиск и структурирование данных;
− осуществлять подготовку и разметку структурированных и неструктурированных данных для машинного обучения.
− навыками решения базовых аналитических кейсов с использованием инструментов визуализации;
− навыками поиска аномалий в данных, сегментации PCA, уменьшения размерности данных
Способен выполнять анализ больших данных
− основы теории баз данных;
− принципы работы NoSQL баз данных;
− основные уровни представления данных;
− особенности организации СУБД в MPP-системе;
− основные типы данных в СУБД Postgres;
− особенности колоночного формата хранения данных;
− принципы построения дашбордов;
− основные понятия теории вероятности;
− основы комбинаторики.
− производить аналитику для интеллектуального отслеживания ресурсов/процессов;
− визуализировать анализируемые данные;
− применять методы анализа на графах;
− создавать собственные модели данных с использованием UML-диаграмм.
− навыками использования статистических методов исследования;
− математическими методами анализа данных;
− навыками интеллектуального анализа данных с помощью языка программирования R
Способен использовать одну или несколько сквозных цифровых субтехнологий искусственного интеллекта
− представление о сквозных цифровых субтехнологиях искусственного интеллекта;
Уметь:− осуществлять математическое и информационное моделирование;
− решать прикладные задачи и участвовать в реализации проектов в области сквозной цифровой субтехнологии «Компьютерное зрение».
− навыками использования предварительно обученных моделей для классификации изображений и других задач;
− навыками обучения нейронной сети Keras многоклассовой классификации изображений на малом количестве данных
Требования
Требования к уровню подготовленности, определяемому контрольно-измерительными материалами.
Обучающиеся должны обладать следующими знаниями, умениями и владеть навыками:
PYTHON:
- Знание синтаксиса языка.
- Понимание базовых структур данных.
- Владение основами ООП (класс, объект).
- Владение базовыми знаниями в алгоритмах (“О” большое и т.д.).
SQL:
- Знание базового синтаксиса SQL.
- Умение составлять подзапросы, временные таблицы.
- Навык работы с оконными функциями.
ИНФРАСТРУКТУРА:
- Навыки работы с Docker.
- Знание базовых команд Linux.
- Навыки работы с системами контроля версий Git.
АНАЛИТИКА:
- Понимание основ математической статистики.
- Понимание основ теории вероятностей.
- Базовые знания в выборе необходимого метода визуализации данных.
Квалификация
Владение необходимыми профессиональными компетенциями
- Способен использовать и адаптировать существующие математические методы и системы программирования для разработки и реализации алгоритмов решения прикладных задач;
- Способен применять и модифицировать математические модели для решения задач в области профессиональной деятельности;
- Владеет широкой общей подготовкой (базовыми знаниями) для решения практических задач в области информационных систем и технологий;
- Способен использовать современные компьютерные технологии поиска информации для решения поставленной задачи, критического анализа этой информации и обоснования принятых идей и подходов к решению;
- Способен выбирать и оценивать способ реализации информационных систем и устройств (программно-, аппаратно- или программно-аппаратно-) для решения поставленной задачи.
Иные требования и рекомендации для обучения по программе
Требования к уровню подготовленности, определяемому контрольно-измерительными материалами.
Обучающиеся должны обладать следующими знаниями, умениями и владеть навыками:
PYTHON:
- Знание синтаксиса языка.
- Понимание базовых структур данных.
- Владение основами ООП (класс, объект).
- Владение базовыми знаниями в алгоритмах (“О” большое и т.д.).
SQL:
- Знание базового синтаксиса SQL.
- Умение составлять подзапросы, временные таблицы.
- Навык работы с оконными функциями.
ИНФРАСТРУКТУРА:
- Навыки работы с Docker.
- Знание базовых команд Linux.
- Навыки работы с системами контроля версий Git.
АНАЛИТИКА:
- Понимание основ математической статистики.
- Понимание основ теории вероятностей.
- Базовые знания в выборе необходимого метода визуализации данных.
Модули
свернутьПреподаватели
Борисов
Вадим Владимирович
Филиал НИУ «МЭИ» в г. Смоленске
Профессор кафедры вычислительной техники
Доктор технических наук
Профессор
Жукова
Людмила Вячеславовна
НИТУ МИСИС
Доцент кафедры «Магистерская школа информационных бизнес-систем»
Кандидат экономических наук
https://1t.ru/teacher-zhukovaСанников
Даниил Александрович
ПАО «Сбербанк»
Главный аналитик данных
Хусаинов
Наиль Шавкятович
ФГАОУ ВО «Южный федеральный университет»
Заведующий кафедрой Института компьютерных технологий и информационной безопасности
Кандидат технических наук
Королева
Диана Олеговна
НИУ ВШЭ
Заведующая лабораторией инноваций в образовании
Костин
Алексей Николаевич
1Т
Менеджер проектов, руководитель направления БАС, преподаватель ДПО
https://1t.ru/teacher-kostinКропивный
Дмитрий Алексеевич
ООО ЭЦ "Социология и аналитика"
Data Scientist
Зиновьев
Дмитрий Владимирович
1Т
Системный аналитик
Лашков
Дмитрий Юрьевич
ООО Верконт Сервис
аналитик данных
Клавдеев
Александр Владимирович
1Т
Старший аналитик данных
Кулакова
Надежда Сергеевна
1Т
Старший аналитик данных
Шарапов
Никита Александрович
1Т
Аналитик-исследователь
Профстандарт
Специалист по большим данным
06.042Специальность
Аналитик данных (Data Scientist)
Ответственный за программу
+79993333307