III уровень

Архитектор данных

Федеральное государственное автономное образовательное учреждение высшего образования «Национальный исследовательский университет ИТМО»
288 часов длительность
Онлайн формат
Продвинутый уровень
1 поток 01.06-30.09.2024
2 поток 25.07-25.11.2024
3 поток 01.09-25.11.2024

Описание

Обучение проходит в смешанном формате — предоставляются материалы онлайн-курса, интерактивная обучающая среда для выполнения упражнений, а также проводятся регулярные вебинары-мастер-классы (в режиме реального времени, и в записи) и консультации. Поддержка обучающихся производится также с помощью чата в Telegram и электронной почты.

Программа ориентирована на слушателей различной направленности. Обязательными являются навыки программирования на любом высокоуровневом языке программирования и знания высшей математики в рамках первого курса технического вуза. Преимуществом будет умение программировать на языке Python. Курс носит практикоориентированный характер. В качестве упражнений пользователи будут обрабатывать наборы данных при помощи инструментов: реляционных СУБД и NoSQL хранилищ, а также ориентированных на методы машинного обучения библиотек языка программирования Python. В качестве обучающих упражнений в программе будут использованы практико-ориентированные кейсы от IT-компаний по актуальным темам в области искусственного интеллекта.

Часов в программе
72 часа
лекции
72 часа
практика
96 часов
самостоятельная
12 часов
промежуточная аттестация
1 час
входная диагностика
36 часов
итоговая аттестация
289 часов
всего
Цель программы
Дать навыки применения и разработки методов обработки и хранения больших данных современными инструментами, а также навыки применения методов математической статистики, машинного обучения и глубокого обучения (на основе нейронных сетей) к интеллектуальному анализу данных для решения прикладных задач, в том числе в области автоматической обработки текстов и компьютерного зрения.
Актуальность
Дополнительная профессиональная программа «Архитектор данных» рассчитана на подготовку специалистов в машинном обучении и науках о данных.
Основная цель программы — сформировать навыки применения методов обработки и хранения больших данных современными инструментами, а также навыки применения методов математической статистики, машинного обучения и глубокого обучения к интеллектуальному анализу данных для решения прикладных задач, в том числе в области автоматической обработки текстов и компьютерного зрения.
Преимуществом программы является не только возможность глубокого изучения методов машинного обучения, но и ее нацеленность на получение практических знаний. В качестве выпускной квалификационной работы слушателям необходимо будет выполнить обязательный проект.
Слушатели, прошедшие обучение в рамках данной программы, смогут претендовать на позиции начинающих разработчиков, аналитиков и ML-инженеров в компаниях различных отраслей экономики. Потребность в таких специалистах в настоящее время огромна.
Входная диагностика 1 час
Входная диагностика содержит вопросы на умение пользоваться файловой системой, знание основ логических операций и основ программирования.
Итоговая аттестация 36 часов
Итоговая аттестация проводится в формате реализации и защиты итогового проекта. Цель проекта: продемонстрировать владение навыками постановки и решения задач анализа данных с помощью изученных методов и алгоритмов.

Компетенции

Общепрофессиональные


Способен классифицировать и идентифицировать задачи искусственного интеллекта, выбирать адекватные методы и инструментальные средства решения задач искусственного интеллекта
Знать:

Классифицирует и идентифицирует задачи систем искусственного интеллекта в зависимости от особенностей проблемной и предметной областей

Уметь:

Выбирает методы и инструментальные средства искусственного интеллекта для решения задач в зависимости от особенностей проблемной области
Собирает исходную информацию и формирует требования к решению задач с использованием методов искусственного интеллекта

Владеть:

язык программирования Python и его библиотеки, электронные таблицы

Способен применять методы и программные средства автоматизированного логического вывода и автоматизированной проверки гипотез
Знать:

Использует методы автоматизированной генерации и проверки гипотез в сфере исследовательской деятельности

Уметь:

Настраивает, конфигурирует и адаптирует программные средства автоматизированного логического вывода в сфере исследовательской деятельности

Владеть:

язык программирования Python и его библиотеки, электронные таблицы

Профессиональные


Способен разрабатывать и тестировать программные компоненты решения задач в системах искусственного интеллекта
Уметь:

Проводит тестирование систем искусственного интеллекта

Способен разрабатывать и применять методы машинного обучения для решения задач
Знать:

Проводит анализ требований и определяет необходимые классы задач машинного обучения
Определяет метрики оценки результатов моделирования и критерии качества построенных моделей

Уметь:

Принимает участие в оценке и выборе используемых методов машинного обучения

Владеть:

язык программирования Python и его библиотеки, Jupyter Notebook

Способен использовать системы искусственного интеллекта на основе нейросетевых моделей и методов
Знать:

Осуществляет оценку и выбор моделей искусственных нейронных сетей и инструментальных средств для решения поставленной задачи

Способен осуществлять сбор и подготовку данных для систем искусственного интеллекта
Уметь:

Выполняет подготовку и разметку структурированных и неструктурированных данных для машинного обучения

Способен создавать и поддерживать системы искусственного интеллекта на основе нейросетевых моделей и методов
Знать:

Осуществляет оценку и выбор моделей искусственных нейронных сетей и инструментальных средств для решения поставленной задачи

Способен создавать и внедрять одну или несколько сквозных цифровых субтехнологий искусственного интеллекта
Уметь:

Участвует в реализации проектов в области сквозной цифровой субтехнологии «Компьютерное зрение»
Участвует в реализации проектов в области сквозной цифровой субтехнологии «Обработка естественного языка»
Участвует в реализации проектов в области сквозной цифровой субтехнологии «Рекомендательные системы и системы поддержки принятия решений»
Участвует в реализации проектов в области сквозной цифровой субтехнологии «Распознавание и синтез речи»
Участвует в реализации проектов в области перспективных сквозных цифровых субтехнологий искусственного интеллект

Требования

Нет

Владение необходимыми профессиональными компетенциями
линейная алгебра
основы математического анализа
основы логики
основы программирования

Модули

свернуть
84ч
Модуль 1 Хранение и обработка больших данных
Модуль освещает вопросы, связанные с поиском, структурированием и представлением данных, разведочным анализом, визуализацией. Рассматриваются построение целевых функций, работа с временными рядами (сглаживание, построение трендов, прогнозирование), регулярные выражения. В качестве инструментов разведочного анализа используются электронные таблицы и язык Python. В качестве среды разработки используется Jupyter Notebook. Изучаются способы организации хранения больших объемов структурированных и неструктурированных данных. В первую очередь, рассматривается проектирование и создание запросов к данным в контексте реляционных СУБД на примере PosrgreSQL. Также дается обзор NoSQL хранилищ.
84ч
Модуль 3 Глубокое обучение и прикладной искусственный интеллект
Основные понятия глубокого обучения. Обсуждаются наиболее популярные и эффективные для решения прикладных задач архитектуры современных нейронных сетей, в том числе многослойные сверточные и рекуррентные нейронные сети. Рассматривается применение методов глубокого обучения для решения прикладных задач в области компьютерного зрения и автоматического обработки текстов. Задачи прикладного искусственного интеллекта. Подходы и технологии, применимые в этой области. Рассматриваются задачи компьютерного зрения, интеллектуального анализа текстов, биометрия и синтез речи, рекомендательные системы.
84ч
Модуль 2 Машинное обучение и элементы статистики
Модуль рассматривает выборочные характеристики случайной величины, точечные оценивание неизвестных параметров генеральной совокупности, сравниваются точечные и интервальные методы оценивания. Рассказывается про задачу проверки гипотез и подробно обсуждаются критерии согласия. Изучаются виды задач машинного обучения. Подробно рассматриваются методы снижения размерности, задача регрессии и подходы к ее решению, задача классификации и некоторые метрические и статистические алгоритмы классификации: логистическая регрессия, метод k-ближайших соседей, наивный байесовский классификатор, метод опорных векторов, деревья принятия решений, а также задача кластеризации с алгоритмами: k-средних и иерархическая (или агломеративная) кластеризация. Рассматриваются и ансамблевые методы, а также направление обучения с подкреплением.
84ч
Модуль 1 Хранение и обработка больших данных
Модуль освещает вопросы, связанные с поиском, структурированием и представлением данных, разведочным анализом, визуализацией. Рассматриваются построение целевых функций, работа с временными рядами (сглаживание, построение трендов, прогнозирование), регулярные выражения. В качестве инструментов разведочного анализа используются электронные таблицы и язык Python. В качестве среды разработки используется Jupyter Notebook. Изучаются способы организации хранения больших объемов структурированных и неструктурированных данных. В первую очередь, рассматривается проектирование и создание запросов к данным в контексте реляционных СУБД на примере PosrgreSQL. Также дается обзор NoSQL хранилищ.
84ч
Модуль 2 Машинное обучение и элементы статистики
Модуль рассматривает выборочные характеристики случайной величины, точечные оценивание неизвестных параметров генеральной совокупности, сравниваются точечные и интервальные методы оценивания. Рассказывается про задачу проверки гипотез и подробно обсуждаются критерии согласия. Изучаются виды задач машинного обучения. Подробно рассматриваются методы снижения размерности, задача регрессии и подходы к ее решению, задача классификации и некоторые метрические и статистические алгоритмы классификации: логистическая регрессия, метод k-ближайших соседей, наивный байесовский классификатор, метод опорных векторов, деревья принятия решений, а также задача кластеризации с алгоритмами: k-средних и иерархическая (или агломеративная) кластеризация. Рассматриваются и ансамблевые методы, а также направление обучения с подкреплением.
84ч
Модуль 3 Глубокое обучение и прикладной искусственный интеллект
Основные понятия глубокого обучения. Обсуждаются наиболее популярные и эффективные для решения прикладных задач архитектуры современных нейронных сетей, в том числе многослойные сверточные и рекуррентные нейронные сети. Рассматривается применение методов глубокого обучения для решения прикладных задач в области компьютерного зрения и автоматического обработки текстов. Задачи прикладного искусственного интеллекта. Подходы и технологии, применимые в этой области. Рассматриваются задачи компьютерного зрения, интеллектуального анализа текстов, биометрия и синтез речи, рекомендательные системы.

Преподаватели

Михайлова

Елена Георгиевна

Федеральное государственное автономное образовательное учреждение высшего образования «Национальный исследовательский университет ИТМО»

директор Высшей школы цифровой культуры университета ИТМО

к.ф.-м.н.

доцент

https://itmo.ru/ru/viewperson/1399/mihaylova_elena_georgievna.htm

Азимов

Рустам Шухратуллович

Федеральное государственное автономное образовательное учреждение высшего образования «Национальный исследовательский университет ИТМО»

Преподаватель

https://disser.spbu.ru/zashchita-uchenoj-stepeni-spbgu/799-azimov-rustam-shukhratullovich.html

Волчек

Дмитрий Геннадьевич

Федеральное государственное автономное образовательное учреждение высшего образования «Национальный исследовательский университет ИТМО»

доцент Высшей школы цифровой

к.т.н.

https://itmo.ru/ru/viewperson/1547/volchek_dmitriy_gennadevich.htm

Графеева

Наталья Генриховна

Федеральное государственное автономное образовательное учреждение высшего образования «Национальный исследовательский университет ИТМО»

доцент Высшей школы цифровой культуры

к.ф.-м.н.

доцент

https://itmo.ru/ru/viewperson/1548/grafeeva_natalya_genrihovna.htm

Егорова

Ольга Борисовна

Федеральное государственное автономное образовательное учреждение высшего образования «Национальный исследовательский университет ИТМО»

преподаватель Высшей школы цифровой культуры университета ИТМО

к.фил.н.

https://itmo.ru/ru/viewperson/1545/egorova_olga_borisovna.htm

Романов

Алексей Андреевич

Федеральное государственное автономное образовательное учреждение высшего образования «Национальный исследовательский университет ИТМО»

доцент Высшей школы цифровой культуры университета ИТМО

к.т.н.

https://itmo.ru/ru/viewperson/1544/romanov_aleksey_andreevich.htm

Самарин

Алексей Владимирович

Федеральное государственное автономное образовательное учреждение высшего образования «Национальный исследовательский университет ИТМО»

преподаватель

Токман

Мария Александровна

Федеральное государственное автономное образовательное учреждение высшего образования «Национальный исследовательский университет ИТМО»

преподаватель

кандидат физ.-мат.наук

https://isu.ifmo.ru/person/296813

Малых

Валентин Андреевич

Федеральное государственное автономное образовательное учреждение высшего образования «Национальный исследовательский университет ИТМО»

доцент

кандидат тех.наук

https://val.maly.hk/

Бойцев

Антон Александрович

Федеральное государственное автономное образовательное учреждение высшего образования «Национальный исследовательский университет ИТМО»

ординарный доцент

к.ф.-м.н.

https://itmo.ru/ru/viewperson/1546/boycev_anton_aleksandrovich.htm
Авторизуйтесь чтобы записаться

Профстандарт

Специалист по большим данным

06.042

Специальность

Архитектор данных (Data Architect)

Ответственный за программу

e.mikhailova@itmo.ru

+79219979791