Большие данные Визуализировать данные Python Разрабатывать и создавать программы и приложения Писать программный код Анализировать данные Обрабатывать данные Хранить данные

Специалист по Big Data

Автономная некоммерческая организация дополнительного профессионального образования "Академия АйТи"
296,00 часов длительность
Онлайн формат
Начальный уровень
1 поток (закрыт) 08.11.2021-18.03.2022
2 поток (закрыт) 23.11.2021-18.03.2022
3 поток (закрыт) 30.11.2021-18.03.2022
4 поток (закрыт) 16.12.2021-12.04.2022

Описание

Большие данные (Big Data) — обозначение структурированных и неструктурированных данных, имеющих огромный объём и значительное многообразие. Управление большими данными предполагает создание и применение информационных технологий нового поколения, обеспечивающих экономически эффективное извлечение, статистическую обработку и визуализацию полезной информации из больших объемов разнообразных данных. Эти технологии применяются в информационно-аналитической деятельности, в системах управления и принятия решений, а также для разработки на их основе новых продуктов и услуг с дальнейшим проведением машинного обучения. В рамках курса будут изучены основы программирования на языке Python для разработки программ для анализа и визуализации больших данных, специальные методы, позволяющие обрабатывать, анализировать, визуализировать, проверять и вычищать данные от имеющихся пропусков и ошибок, а также основы статистики для первичной обработки данных и выявления имеющихся тенденций.

После изучения курса слушатели будут

знать:

- методы анализа больших данных на всех этапах жизненного цикла методологической и технологической инфраструктуры в организации;

уметь:

- загружать данные из разных источников;

- собирать, очищать, подготавливать и объединять полученные данные;

- производить сцепление и наложение данных, слияние и замену значений;

- работать с пропущенными значениями, повторами, объединением и переформированием данных;

- осуществлять фильтрацию, группировку, агрегацию и выполнять описательную статистики

- вычислять центральную тенденции, среднее, медиану и моду;

- выполнять разведывательный анализ, вычислять дисперсию, стандартное отклонение, ковариации, корреляции, строить распределение и заниматься постановкой гипотез

- применять методы и технологии исследования больших данных;

владеть навыками:

- разработки продуктов, услуг и решений на основе больших данных,

- анализа больших данных с использованием существующей в организации методологической и технологической инфраструктуры.

Часов в программе
126,00 часов
лекции
160,00 часов
практика
3,00 часа
промежуточная аттестация
1 час
входная диагностика
6 часов
итоговая аттестация
296,00 часов
всего
Цель программы
Получение компетенций для выполнения нового вида профессиональной деятельности в области создания и применения технологий больших данных, необходимых для профессиональной деятельности, осуществляемой в области решения задач алгоритмизации и написания программного кода для анализа больших данных с использованием языков программирования; прогнозирования и визуализации на основе интеллектуальной обработки массива информации; управления на основе анализа больших данных на всех этапах жизненного цикла методологической и технологической инфраструктуры в организации.
Актуальность
Большие данные (big data) — обозначение структурированных и неструктурированных данных огромных объёмов и значительного многообразия. В качестве источников такой информации могут выступать непрерывно поступающие данные с измерительных устройств и детекторов, потоки сообщений из социальных сетей, метеорологические данные, данные дистанционного зондирования земли, потоки данных о местонахождении абонентов сетей сотовой связи. Существующие решения для управления большими объёмами данных в области информационных технологий помогают эффективно переносить, хранить и анализировать данные. Решения Big Data уже доказали свою необходимость в современном мире бизнеса. Их интеграция стремительно увеличивает эффективность работы компании и гарантирует значительный рост дохода.
Программа профессиональной переподготовки отвечает новым требованиям к ключевым компетенциям цифровой экономики: умению учиться в условиях постоянно меняющихся реалий, решать задачи в технологически насыщенной среде, управлять информацией и данными.
После окончания курсов слушатели приобретут возможность ведения профессиональной деятельности в новой сфере для лиц, не имеющих базового образования в области программирования и работы с большими данными, так и смогут расширить имеющуюся сферу деятельности программиста, руководителя служб и подразделений в сфере информационно-коммуникационных технологий или системного аналитика. Зарплата такого специалиста в регионах составляет не менее 50 тысяч рублей, в столице не менее 80 тысяч, а в среднем 120-180 тысяч рублей.
Входная диагностика 1 час
Входная диагностика – выявление стартовых возможностей слушателей, измерение соответствующих программе компетенций перед началом обучения.
Задачи входной диагностики:
• Прогнозирование возможности успешного обучения;
• Определение мотивационной готовности слушателей;
• Определение базового уровня знаний и умений слушателей.
Входная диагностика охватывает всех обучаемых и проводится в форме тестирования.
Входное тестирование предназначено для самоопределения слушателями уровня знаний, разработано с учетом последующей возможности сопоставления полученных данных с итоговой аттестацией. Тестирование проводится в системе дистанционного обучения. На прохождение входного тестирования дается одна попытка. Тест включает в себя 15 вопросов.
Итоговая аттестация 6 часов
Экзамен. Выполнение практического задания

Компетенции

Общепрофессиональные


Способность осуществлять поиск, хранение, обработку и анализ информации из различных источников и баз данных, представлять ее в требуемом формате с использованием информационных, компьютерных и сетевых технологий
Знать:

Типы больших данных: метаданные, полуструктурированные, структурированные, неструктурированные
Виды источников данных: созданные человеком, созданные машинами. Источники информации, в том числе информации, необходимой для обеспечения деятельности в предметной области заказчика исследования. Технологии хранения и обработки больших данных в организации: базы данных, хранилища данных, распределенная и параллельная обработка данных, вычисления в оперативной памяти

Уметь:

Использовать инструментальные средства для извлечения, преобразования, хранения и обработки данных из разнородных источников, в том числе в режиме реального времени.

Владеть:

Навык определения источников больших данных для анализа, идентификация внешних и внутренних источников данных для проведения аналитических работ. Навык получения и фильтрация больших объемов данных из гетерогенных источников

Профессиональные


Способность решения задач алгоритмизации и написания программного кода для анализа больших данных с использованием языков программирования
Знать:

Методы и инструменты получения и приобретения больших данных.
Методы и инструменты извлечения, преобразования, загрузки и обработки больших данных. Современный опыт использования технологий больших данных в части разработки новых методов, моделей, алгоритмов, технологий и инструментальных средств.

Уметь:

Программировать на языках высокого уровня, ориентированных на работу с большими данными: для статистической обработки данных и работы с графикой, для работы с разрозненными фрагментами данных в больших массивах, для работы с базами структурированных и неструктурированных данных.

Владеть:

Навыком применения технологий больших данных в практических задачах предметной области. Навыком применения современных и перспективных средств визуализации и интерпретации больших данных с использованием языков программирования.

Способность прогнозирования и визуализации на основе интеллектуальной обработки массива информации
Знать:

Методы интерпретации и визуализации больших данных. Технологии анализа данных.

Уметь:

Проводить интеграцию и преобразование больших объемов данных. Формировать предложения по использованию результатов анализа. Оформлять результаты аналитического исследования для представления заказчику

Владеть:

Навык осуществлять интеграцию и преобразование данных в ходе работ по анализу больших данных. Выбор средств представления результатов аналитики больших данных. Навык формирования предложений по развитию существующей методологической и технологической инфраструктуры анализа больших данных на основе выполненных работ

Способность управления на основе анализа больших данных на всех этапах жизненного цикла методологической и технологической инфраструктуры в организации
Знать:

Предметную область анализа больших данных в соответствии с требованиями заказчика. Современный опыт использования анализа больших данных. Теоретические и прикладные основы анализа данных. Типы анализа больших данных, виды аналитики.
Теория вероятностей и математическая статистика. Современные методы и инструментальные средства анализа больших данных.

Уметь:

Использовать имеющуюся у исполнителя методологическую и технологическую инфраструктуру анализа больших данных для выполнения аналитических работ. Проводить сравнительный анализ методов и инструментальных средств анализа больших данных.

Владеть:

Навык анализа и выбора методов и методик анализа больших данных и составления рекомендации по их использованию.

Требования

Нет

Образование
  • Высшее образование
  • Среднее профессиональное образование

Модули

свернуть
151,00ч
Модуль 1 Базовый модуль: Основы программирования и составления алгоритмов
Слушатели знакомятся с основными элементами и этапами составления алгоритмов, способами хранения данных в компьютере и типовыми операторами языков программирования, этапами перевода блок-схем в код программы, особенностями и тонкостями перевода программы из алгоритмов в операторы, обозначат основные отличия массива от списка, узнают о кодировках текста и особенностях хранения и обработки текстовой информации, использовании стека, очереди, списка, дерева, узнают различные версии языка Python, познакомятся с интерпретаторами и трансляторами, основными принципами работы интерпретатора Python, основными элементами программирования, научатся устанавливать и запускать интерпретатор Python, устанавливать и тестировать среды разработки Python, узнают об основных операторах ветвления и цикла, генераторами словарей и списков. Успешное прохождение модуля позволит специалистам: составлять алгоритм решения типовых задач, составлять подходящие типы данных для реализации типовых алгоритмов, составлять алгоритмы поиска данных и оценивать их эффективность, составлять алгоритмы с использованием массивов для реализации наиболее актуальных задач, составлять алгоритмы по реализации стека, очереди и других аналогичных конструкций, разбираться в версиях языка Python, устанавливать и запускать интерпретатор Python, устанавливать и тестировать среды разработки Python, составлять программы с использованием генераторов словарей и списков.
78,00ч
Модуль 3 Профильный модуль: Data Science. Обработка, анализ и визуализация данных на языке Python. Библиотеки pandas, numpy, matplotlib и seaborn
Модуль является профильным и посвящен непосредственно работе с большими данными (Data Science) путем обработки, анализа и визуализации данных на языке Python. В нем будут изучены методы и инструменты первичной обработки данных (сбор, очистка, подготовка, объединение, переформатирование и т.д.), статистики и анализа (постановка гипотезы, фильтрация, группировка, агрегация данных, получение различных видов итогов, разведывательный анализ и т.д.). Освоение работы с библиотеками pandas, numpy, matplotlib и seaborn позволит специалистам собирать, анализировать и визуализировать данные, выдвигать гипотезы и делать выводы на основе данных. Слушатели смогут написать эффективный код на Python, превратить сырые данные в полезную информацию для компании, научатся понимать математику на основе статистики, прогнозировать и визуализировать результаты.
60,00ч
Модуль 2 Профильный модуль: Расширенные возможности Python
Слушатели знакомятся с основными методами работы с библиотеками и исключениями в Python, особенностями создания функций, методами работы с файловой системой и файлами Python, особенностями установки пакетов в различных операционных системах, основными моментами по созданию собственного класса исключений, работы с реляционными базами данных, создания классов, наследования, основными абстрактными классами. Успешное прохождение модуля позволит специалистам: писать программы с использованием обработки исключения, составлять программы с использованием функций с переменным количеством аргументов, составлять программы чтения и записи информации в файл, устанавливать новые пакеты и сторонние модули, создавать собственное исключение и использовать его в программе, писать программу, осуществляющую работу с базой данных SQLite3, писать программу, использующую классы, писать программу, применяющую классы в Python.
151,00ч
Модуль 1 Базовый модуль: Основы программирования и составления алгоритмов
Слушатели знакомятся с основными элементами и этапами составления алгоритмов, способами хранения данных в компьютере и типовыми операторами языков программирования, этапами перевода блок-схем в код программы, особенностями и тонкостями перевода программы из алгоритмов в операторы, обозначат основные отличия массива от списка, узнают о кодировках текста и особенностях хранения и обработки текстовой информации, использовании стека, очереди, списка, дерева, узнают различные версии языка Python, познакомятся с интерпретаторами и трансляторами, основными принципами работы интерпретатора Python, основными элементами программирования, научатся устанавливать и запускать интерпретатор Python, устанавливать и тестировать среды разработки Python, узнают об основных операторах ветвления и цикла, генераторами словарей и списков. Успешное прохождение модуля позволит специалистам: составлять алгоритм решения типовых задач, составлять подходящие типы данных для реализации типовых алгоритмов, составлять алгоритмы поиска данных и оценивать их эффективность, составлять алгоритмы с использованием массивов для реализации наиболее актуальных задач, составлять алгоритмы по реализации стека, очереди и других аналогичных конструкций, разбираться в версиях языка Python, устанавливать и запускать интерпретатор Python, устанавливать и тестировать среды разработки Python, составлять программы с использованием генераторов словарей и списков.
60,00ч
Модуль 2 Профильный модуль: Расширенные возможности Python
Слушатели знакомятся с основными методами работы с библиотеками и исключениями в Python, особенностями создания функций, методами работы с файловой системой и файлами Python, особенностями установки пакетов в различных операционных системах, основными моментами по созданию собственного класса исключений, работы с реляционными базами данных, создания классов, наследования, основными абстрактными классами. Успешное прохождение модуля позволит специалистам: писать программы с использованием обработки исключения, составлять программы с использованием функций с переменным количеством аргументов, составлять программы чтения и записи информации в файл, устанавливать новые пакеты и сторонние модули, создавать собственное исключение и использовать его в программе, писать программу, осуществляющую работу с базой данных SQLite3, писать программу, использующую классы, писать программу, применяющую классы в Python.
78,00ч
Модуль 3 Профильный модуль: Data Science. Обработка, анализ и визуализация данных на языке Python. Библиотеки pandas, numpy, matplotlib и seaborn
Модуль является профильным и посвящен непосредственно работе с большими данными (Data Science) путем обработки, анализа и визуализации данных на языке Python. В нем будут изучены методы и инструменты первичной обработки данных (сбор, очистка, подготовка, объединение, переформатирование и т.д.), статистики и анализа (постановка гипотезы, фильтрация, группировка, агрегация данных, получение различных видов итогов, разведывательный анализ и т.д.). Освоение работы с библиотеками pandas, numpy, matplotlib и seaborn позволит специалистам собирать, анализировать и визуализировать данные, выдвигать гипотезы и делать выводы на основе данных. Слушатели смогут написать эффективный код на Python, превратить сырые данные в полезную информацию для компании, научатся понимать математику на основе статистики, прогнозировать и визуализировать результаты.

Преподаватели

Рулёв

Сергей Викторович

Автономная некоммерческая организация дополнительного профессионального образования "Академия АйТи"

Преподаватель-практик, имеющий многолетний опыт работы финансовым директором в крупнейших российских компаниях. Обладатель статусов MCT (MICROSOFT CERTIFIED TRAINER), MCP (MICROSOFT CERTIFIED PROFESSIONAL), а так же степени MBA (Master of Business Administration, Магистр Делового Администрирования), полученной в Американском Институте Бизнеса и Экономики.

83 998 p
Авторизуйтесь чтобы записаться

Профстандарт

Специалист по большим данным

06.042

Ответственный за программу

gyunicheva@it.ru

+79677403554