III уровень Искусственный интеллект

Архитектор данных

Федеральное государственное автономное образовательное учреждение высшего образования «Национальный исследовательский университет ИТМО»
288 часов длительность
Онлайн формат
Продвинутый уровень
1 поток (закрыт) 01.06-22.09.2023
2 поток (закрыт) 21.08-04.12.2023

Описание

Обучение проходит в смешанном формате — предоставляются материалы онлайн-курса, интерактивная обучающая среда для выполнения упражнений, а также проводятся регулярные вебинары-мастер-классы (в режиме реального времени, и в записи) и консультации. Поддержка обучающихся производится также с помощью чата в Telegram и электронной почты.

Программа ориентирована на слушателей различной направленности. Обязательными являются навыки программирования на любом высокоуровневом языке программирования и знания высшей математики в рамках первого курса технического вуза. Преимуществом будет умение программировать на языке Python. Курс носит практикоориентированный характер. В качестве упражнений пользователи будут обрабатывать наборы данных при помощи инструментов: реляционных СУБД и NoSQL хранилищ, а также ориентированных на методы машинного обучения библиотек языка программирования Python. В качестве обучающих упражнений в программе будут использованы практико-ориентированные кейсы от компании Диджитал Дизайн по актуальным темам в области искусственного интеллекта.

Часов в программе
84 часа
лекции
77 часов
практика
110 часов
самостоятельная
28 часов
промежуточная аттестация
1 час
входная диагностика
36 часов
итоговая аттестация
336 часов
всего
Цель программы
Дать навыки применения и разработки методов обработки и хранения больших данных современными инструментами, а также навыки применения методов математической статистики, машинного обучения и глубокого обучения (на основе нейронных сетей) к интеллектуальному анализу данных для решения прикладных задач, в том числе в области автоматической обработки текстов и компьютерного зрения.
Актуальность
Дополнительная профессиональная программа «Архитектор данных» рассчитана на подготовку специалистов в машинном обучении и науках о данных.
Основной целью программы является сформировать навыки применения методов обработки и хранения больших данных современными инструментами, а также навыки применения методов математической статистики, машинного обучения и глубокого обучения к интеллектуальному анализу данных для решения прикладных задач, в том числе в области автоматической обработки текстов и компьютерного зрения.
Преимуществом программы является не только возможность глубокого изучения методов машинного обучения, но и ее нацеленность на получение практических знаний. В качестве выпускной квалификационной работы слушателям необходимо будет выполнить обязательный проект.
Слушатели, прошедшие обучение в рамках данной программы, смогут претендовать на позиции начинающих разработчиков, аналитиков и ML-инженеров в компания различных отраслей экономики. Потребность в таких специалистах в настоящее время огромна.
Входная диагностика 1 час
Входная диагностика содержит вопросы на умение пользоваться файловой системой, знание основ логических операций и основ программирования.
Итоговая аттестация 36 часов
Итоговая аттестация проводится в формате реализации и защиты итогового проекта. Цель проекта: продемонстрировать владение навыками постановки и решения задач анализа данных с помощью изученных методов и алгоритмов.

Компетенции

Общепрофессиональные


Способен классифицировать и идентифицировать задачи искусственного интеллекта, выбирать адекватные методы и инструментальные средства решения задач искусственного интеллекта
Знать:

Классифицирует и идентифицирует задачи систем искусственного интеллекта в зависимости от особенностей проблемной и предметной областей

Уметь:

Выбирает методы и инструментальные средства искусственного интеллекта для решения задач в зависимости от особенностей проблемной области
Собирает исходную информацию и формирует требования к решению задач с использованием методов искусственного интеллекта

Способен применять методы и программные средства автоматизированного логического вывода и автоматизированной проверки гипотез
Знать:

Использует методы автоматизированной генерации и проверки гипотез в сфере исследовательской деятельности

Уметь:

Настраивает, конфигурирует и адаптирует программные средства автоматизированного логического вывода в сфере исследовательской деятельности

Профессиональные


Способен разрабатывать и тестировать программные компоненты решения задач в системах искусственного интеллекта
Уметь:

Проводит тестирование систем искусственного интеллекта

Способен разрабатывать и применять методы машинного обучения для решения задач
Знать:

Проводит анализ требований и определяет необходимые классы задач машинного обучения
Определяет метрики оценки результатов моделирования и критерии качества построенных моделей

Уметь:

Принимает участие в оценке и выборе используемых методов машинного обучения

Способен использовать системы искусственного интеллекта на основе нейросетевых моделей и методов
Знать:

Осуществляет оценку и выбор моделей искусственных нейронных сетей и инструментальных средств для решения поставленной задачи

Способен осуществлять сбор и подготовку данных для систем искусственного интеллекта
Уметь:

Выполняет подготовку и разметку структурированных и неструктурированных данных для машинного обучения

Способен создавать и поддерживать системы искусственного интеллекта на основе нейросетевых моделей и методов
Знать:

Осуществляет оценку и выбор моделей искусственных нейронных сетей и инструментальных средств для решения поставленной задачи

Способен создавать и внедрять одну или несколько сквозных цифровых субтехнологий искусственного интеллекта
Уметь:

Участвует в реализации проектов в области сквозной цифровой субтехнологии «Компьютерное зрение»
Участвует в реализации проектов в области сквозной цифровой субтехнологии «Обработка естественного языка»
Участвует в реализации проектов в области сквозной цифровой субтехнологии «Рекомендательные системы и системы поддержки принятия решений»
Участвует в реализации проектов в области сквозной цифровой субтехнологии «Распознавание и синтез речи»
Участвует в реализации проектов в области перспективных сквозных цифровых субтехнологий искусственного интеллект

Требования

Нет

Образование
  • Высшее образование
  • Среднее профессиональное образование
Предварительное освоение иных дисциплин/курсов /модулей
линейная алгебра
основы математического анализа
основы логики
основы программирования

Модули

свернуть
33ч
Модуль 1 Разведочный анализ данных
Модуль освещает вопросы, связанные с поиском, структурированием и представлением данных, разведочным анализом, визуализацией. Особое внимание уделяется анализу временных рядов - сглаживанию, построению трендов, прогнозированию. Рассматриваются вопросы, связанные с построением целевых функций. Рассматриваются регулярные выражения. В качестве инструментов разведочного анализа используются электронные таблицы и язык Python. В качестве среды разработки используется Jupyter Notebook. Особое внимание уделяется работе с большими данными (возможностям получения из различных источников, обработки, визуализации). Рассматриваются приемы работы с различными форматами данных, библиотеки NumPy, Pandas и их особенности.
37ч
Модуль 3 NоSQL хранилища данных
Дисциплина знакомит слушателей с основами проектирования и использования NoSQL хранилищ данных. Рассматриваются технологии, характерные для NoSQL-систем, классификация и приемы работы с наиболее популярными представителями хранилищ типа ключ-значение, документных хранилищ, колоночных и графовых.
86ч
Модуль 5 Методы машинного обучения
Дисциплина знакомит слушателей с задачами машинного обучения, решение которых востребовано в настоящее время. Подробно рассматривается задача регрессии и подходы к ее решению, задача классификации и некоторые метрические и статистические алгоритмы классификации: логистическая регрессия, метод k-ближайших соседей, байесовский классификатор, а также задача кластеризации с алгоритмами: k-средних и иерархическая (или агломеративная) кластеризация. Рассматриваются и более продвинутые подходы: снижение размерности и ансамблевые методы.
36ч
Модуль 7 Прикладной искусственный интеллект
Дисциплина знакомит слушателей с задачами прикладного искусственного интеллекта и показывает подходы и технологии, применимые в этой области. Рассматриваются задачи компьютерного зрения, интеллектуального анализа текстов, биометрия и синтез речи, рекомендательные системы.
35ч
Модуль 2 Хранение структурированных данных, SQL
Дисциплина рассматривает вопросы, связанные с организацией современных баз данных. Особое внимание уделяется проектированию структурированных данных, описанию ограничений целостности. Изучаются SQL DDL и DML. Рассматриваются запросы с агрегированием и соединением, аналитические функции. Также дается представление об оптимизации запросов и применении индексов.
36ч
Модуль 4 Элементы статистики
Дисциплина знакомит слушателей с основами теории вероятностей: изучаются одномерные и многомерные случайные величины, их характеристики, закон больших чисел и центральная предельная теорема. Изучение статистики начинается с выборочных характеристик, продолжается точечным оцениванием неизвестных параметров генеральной совокупности, сравниваются точечные и интервальные методы оценивания. Рассказывается про задачу проверки гипотез и подробно обсуждаются критерии согласия.
36ч
Модуль 6 Глубокое обучение и его практические применения
Дисциплина знакомит слушателей с основными понятиями глубокого обучения. Обсуждаются наиболее популярные и эффективные для решения прикладных задач архитектуры современных нейронных сетей, в том числе многослойные сверточные и рекуррентные нейронные сети. Рассматривается применение методов глубокого обучения для решения прикладных задач в области компьютерного зрения и автоматического обработки текстов.
33ч
Модуль 1 Разведочный анализ данных
Модуль освещает вопросы, связанные с поиском, структурированием и представлением данных, разведочным анализом, визуализацией. Особое внимание уделяется анализу временных рядов - сглаживанию, построению трендов, прогнозированию. Рассматриваются вопросы, связанные с построением целевых функций. Рассматриваются регулярные выражения. В качестве инструментов разведочного анализа используются электронные таблицы и язык Python. В качестве среды разработки используется Jupyter Notebook. Особое внимание уделяется работе с большими данными (возможностям получения из различных источников, обработки, визуализации). Рассматриваются приемы работы с различными форматами данных, библиотеки NumPy, Pandas и их особенности.
35ч
Модуль 2 Хранение структурированных данных, SQL
Дисциплина рассматривает вопросы, связанные с организацией современных баз данных. Особое внимание уделяется проектированию структурированных данных, описанию ограничений целостности. Изучаются SQL DDL и DML. Рассматриваются запросы с агрегированием и соединением, аналитические функции. Также дается представление об оптимизации запросов и применении индексов.
37ч
Модуль 3 NоSQL хранилища данных
Дисциплина знакомит слушателей с основами проектирования и использования NoSQL хранилищ данных. Рассматриваются технологии, характерные для NoSQL-систем, классификация и приемы работы с наиболее популярными представителями хранилищ типа ключ-значение, документных хранилищ, колоночных и графовых.
36ч
Модуль 4 Элементы статистики
Дисциплина знакомит слушателей с основами теории вероятностей: изучаются одномерные и многомерные случайные величины, их характеристики, закон больших чисел и центральная предельная теорема. Изучение статистики начинается с выборочных характеристик, продолжается точечным оцениванием неизвестных параметров генеральной совокупности, сравниваются точечные и интервальные методы оценивания. Рассказывается про задачу проверки гипотез и подробно обсуждаются критерии согласия.
86ч
Модуль 5 Методы машинного обучения
Дисциплина знакомит слушателей с задачами машинного обучения, решение которых востребовано в настоящее время. Подробно рассматривается задача регрессии и подходы к ее решению, задача классификации и некоторые метрические и статистические алгоритмы классификации: логистическая регрессия, метод k-ближайших соседей, байесовский классификатор, а также задача кластеризации с алгоритмами: k-средних и иерархическая (или агломеративная) кластеризация. Рассматриваются и более продвинутые подходы: снижение размерности и ансамблевые методы.
36ч
Модуль 6 Глубокое обучение и его практические применения
Дисциплина знакомит слушателей с основными понятиями глубокого обучения. Обсуждаются наиболее популярные и эффективные для решения прикладных задач архитектуры современных нейронных сетей, в том числе многослойные сверточные и рекуррентные нейронные сети. Рассматривается применение методов глубокого обучения для решения прикладных задач в области компьютерного зрения и автоматического обработки текстов.
36ч
Модуль 7 Прикладной искусственный интеллект
Дисциплина знакомит слушателей с задачами прикладного искусственного интеллекта и показывает подходы и технологии, применимые в этой области. Рассматриваются задачи компьютерного зрения, интеллектуального анализа текстов, биометрия и синтез речи, рекомендательные системы.

Преподаватели

Михайлова

Елена Георгиевна

Федеральное государственное автономное образовательное учреждение высшего образования «Национальный исследовательский университет ИТМО»

директор Высшей школы цифровой культуры университета ИТМО

к.ф.-м.н.

доцент

https://itmo.ru/ru/viewperson/1399/mihaylova_elena_georgievna.htm

Бойцев

Антон Александрович

Федеральное государственное автономное образовательное учреждение высшего образования «Национальный исследовательский университет ИТМО»

ординарный доцент

к.ф.-м.н.

https://itmo.ru/ru/viewperson/1546/boycev_anton_aleksandrovich.htm

Графеева

Наталья Генриховна

Федеральное государственное автономное образовательное учреждение высшего образования «Национальный исследовательский университет ИТМО»

доцент Высшей школы цифровой культуры

к.ф.-м.н.

доцент

https://itmo.ru/ru/viewperson/1548/grafeeva_natalya_genrihovna.htm

Самарин

Алексей Владимирович

Федеральное государственное автономное образовательное учреждение высшего образования «Национальный исследовательский университет ИТМО»

преподаватель

Волчек

Дмитрий Геннадьевич

Федеральное государственное автономное образовательное учреждение высшего образования «Национальный исследовательский университет ИТМО»

доцент Высшей школы цифровой

к.т.н.

https://itmo.ru/ru/viewperson/1547/volchek_dmitriy_gennadevich.htm

Романов

Алексей Андреевич

Федеральное государственное автономное образовательное учреждение высшего образования «Национальный исследовательский университет ИТМО»

доцент Высшей школы цифровой культуры университета ИТМО

к.т.н.

https://itmo.ru/ru/viewperson/1544/romanov_aleksey_andreevich.htm

Егорова

Ольга Борисовна

Федеральное государственное автономное образовательное учреждение высшего образования «Национальный исследовательский университет ИТМО»

преподаватель Высшей школы цифровой культуры университета ИТМО

к.фил.н.

https://itmo.ru/ru/viewperson/1545/egorova_olga_borisovna.htm

Азимов

Рустам Шухратуллович

Федеральное государственное автономное образовательное учреждение высшего образования «Национальный исследовательский университет ИТМО»

Преподаватель

https://disser.spbu.ru/zashchita-uchenoj-stepeni-spbgu/799-azimov-rustam-shukhratullovich.html
Авторизуйтесь чтобы записаться

Профстандарт

Специалист по большим данным

06.042

Специальность

Архитектор данных (Data Architect)

Ответственный за программу

e.mikhailova@itmo.ru

+79219979791