III уровень Большие данные

Большие данные

ОБРАЗОВАТЕЛЬНАЯ АВТОНОМНАЯ НЕКОММЕРЧЕСКАЯ ОРГАНИЗАЦИЯ ВЫСШЕГО ОБРАЗОВАНИЯ "МОСКОВСКИЙ ТЕХНОЛОГИЧЕСКИЙ ИНСТИТУТ
72,00 часа длительность
Онлайн формат
Начальный уровень

Описание

Тема 1. Ведение в анализ больших данных. Обзор источников (12 ак. часов)

Основные определения. Задачи анализа больших данных. Вопросы безопасности.Понятие Data Mining. Когнитивный анализ данных. Обзор источников информации для Big Data (открытые источники информации, статистические сборники, опубликованные отчеты и результаты исследований; доступ к закрытой информации).Методики сбора данных.

Тема  2. Технологии хранения и обработки больших данных (10 ак. часов)

Конфигурации и профили в Java ME .Среды разработки, версии Java ME, профили MIDL 1 и 2, их отличительные особенности, требования к аппаратной среде.  Мидлеты. Жизненный цикл мидлета. События высокого и низкого уровня; компоненты пользовательского интерфейса. Сборка и запуск сложных мидлетов. Компиляция, верификация, загрузка мидлета, отладка; сетевое взаимодействие, тонкие клиенты; 

Тема  3. Статистические методы анализа (8 ак. часа)

Статистика. Параметрический метод. Непараметрический метод. Номинальные метод.

Тема  4. Современные программные средства анализа  (10 ак. часов)

Обзор современных популярных программных средства анализа данных: Statistica, SPSS, Excel, R-Studio и другие; 

Тема  5. Сбор и хранение больших данных (10 ак. часов)

Поиск источников информации в сети Интернет: открытые и закрытые источники данных Портал открытых данных РФ. Сохранение данных в программе Excel. Преобразование и первичная обработка данных. 

Тема  6. Методы обработки и анализа больших данных (10 ак. часов)

Представление исходных данных в программе R-Studio (векторы, массивы, матрицы, списки, таблицы). Статистическая обработка данных в программах Excel и R-Studio: подсчет описательных статистик, графическое представление данных. Группировка данных, обнаружение значимых корреляций, зависимостей и тенденций в результате анализа имеющейся информации, выявления отношений между данными различного типа. Применение различных методов выделения, извлечения и группировки данных, которые позволяют выявить систематизированные структуры данных и вывести из них правила для принятия решений и прогнозирования их последствий (регрессионный, дисперсионный, кластерный, дискриминантный, факторный анализы).

Тема  7. Визуализация исходной информации и данных (10 ак. часов)

Возможности графического представления информации в программе R-Studio: графические функции отображения одномерных и многомерных данных, графический вывод с использованием графических параметров. Формирование команды. Стили управления.

Цель программы
Формирование базовой системы знаний и навыков в области искусственного интеллекта и машинного обучения

Требования

  • Предыдущее образование: высшее или среднее профессиональное
  • Квалификация и опыт профессиональной деятельности: не имеют значения; специальной подготовки для прохождения программы не требуется
Иные требования и рекомендации для обучения по программе
  • Предыдущее образование: высшее или среднее профессиональное
  • Квалификация и опыт профессиональной деятельности: не имеют значения; специальной подготовки для прохождения программы не требуется

Модули

свернуть
Модуль 1 Введение в анализ больших данных. Обзор источников
• Big Data - основные определения и понятия • Главные задачи области “Больших данных” • Актуальность темы безопасности в “Big Data” • Уменьшение рисков при работе с данными • Повышение операционной эффективности при работе с данными • Интеллектуальный анализ данных • Обнаружение в данных ранее неизвестной информации • Выборка необходимой информации • Различия объёмов стандартной информации от большой информации • Взаимосвязь общей информации с большой информацией • Структурирование большой информации • Большие объёмы данных на сегодняшний день • Сферы применения большой информации в реальной жизни • Принцип трёх “V” при работе с данными
Модуль 3 Статистически методы анализа
• Основные виды статистических сборов инфомрации • Объект исследования • Ранжировка по важности статистических данных • Суть параметрического метода • Норма отклонения • Подтверждаемость предположений • Суть непараметрического метода • Норма принятия за среднюю статистическую • Подтверждаемость предположений о средней выборки • Суть номинального метода • Что можно считать за номинальную норму • Определение самого важного номинала
Модуль 5 Сбор и хранение больших данных
• Типы исследуемой информации в Интернете • Защита информации в Интернете • Надёжность достоверности источников информации в Интернете • Что такое “Портал открытых данных в РФ” • Новые наборы данных • Из чего состоиот пакет “Microsoft Office” • Разработка моделей анализа данных • Сводка данных
Модуль 7 Визуализация исходной информации и данных
• Графическая функция в “R-Studio” • Двухмерные графический вывод данных • Функционал терминала в “R-Studio” • Наём качественных кадров в команду • Классификация качественных кадров • Основные принципы высокоэффективной команды • Виды стилей управления • Самые важные качества для руководства и подчинённых • Увеличение эффективности персонала
Модуль 2 Технологии обработки и хранения больших данных
• Особенности Java ME • Ограничения использования Java ME • История Java ME • Java для мобильных устройств • Java ME: архитектура и возможности • Java ME: недостатки и приемущества • События высокого и низкого уровня; компоненты пользовательского интерфейса • Компиляция • Сетевое взаимодействие, протоколы • События высокого и низкого уровня • Капсула информации необходимая для интерфейса • Технологии UI • Модель клиентсервер • Взаимодействие мидлетов с серверным ПО через сеть • Верификация
Модуль 4 Современные программные средства анализа
• Знакомство с программами Statistica • Основные настройки Excel • Возможности R-Studio
Модуль 6 Методы обработки и анализа больших данных
• Что такое R-Studio • GNU/Linux • MatLab/Octave • Как вместе работают “R-Studio”и “Excel” • Как прочесть бинарные данные в “R-Studio” • Способы загрузки данных в “R-Studio” • Оптимизация данных путём объединения • Оптимизация с помощью “средней” нормативной меры • Простая линейная корреляция
Модуль 1 Введение в анализ больших данных. Обзор источников
• Big Data - основные определения и понятия • Главные задачи области “Больших данных” • Актуальность темы безопасности в “Big Data” • Уменьшение рисков при работе с данными • Повышение операционной эффективности при работе с данными • Интеллектуальный анализ данных • Обнаружение в данных ранее неизвестной информации • Выборка необходимой информации • Различия объёмов стандартной информации от большой информации • Взаимосвязь общей информации с большой информацией • Структурирование большой информации • Большие объёмы данных на сегодняшний день • Сферы применения большой информации в реальной жизни • Принцип трёх “V” при работе с данными
Модуль 2 Технологии обработки и хранения больших данных
• Особенности Java ME • Ограничения использования Java ME • История Java ME • Java для мобильных устройств • Java ME: архитектура и возможности • Java ME: недостатки и приемущества • События высокого и низкого уровня; компоненты пользовательского интерфейса • Компиляция • Сетевое взаимодействие, протоколы • События высокого и низкого уровня • Капсула информации необходимая для интерфейса • Технологии UI • Модель клиентсервер • Взаимодействие мидлетов с серверным ПО через сеть • Верификация
Модуль 3 Статистически методы анализа
• Основные виды статистических сборов инфомрации • Объект исследования • Ранжировка по важности статистических данных • Суть параметрического метода • Норма отклонения • Подтверждаемость предположений • Суть непараметрического метода • Норма принятия за среднюю статистическую • Подтверждаемость предположений о средней выборки • Суть номинального метода • Что можно считать за номинальную норму • Определение самого важного номинала
Модуль 4 Современные программные средства анализа
• Знакомство с программами Statistica • Основные настройки Excel • Возможности R-Studio
Модуль 5 Сбор и хранение больших данных
• Типы исследуемой информации в Интернете • Защита информации в Интернете • Надёжность достоверности источников информации в Интернете • Что такое “Портал открытых данных в РФ” • Новые наборы данных • Из чего состоиот пакет “Microsoft Office” • Разработка моделей анализа данных • Сводка данных
Модуль 6 Методы обработки и анализа больших данных
• Что такое R-Studio • GNU/Linux • MatLab/Octave • Как вместе работают “R-Studio”и “Excel” • Как прочесть бинарные данные в “R-Studio” • Способы загрузки данных в “R-Studio” • Оптимизация данных путём объединения • Оптимизация с помощью “средней” нормативной меры • Простая линейная корреляция
Модуль 7 Визуализация исходной информации и данных
• Графическая функция в “R-Studio” • Двухмерные графический вывод данных • Функционал терминала в “R-Studio” • Наём качественных кадров в команду • Классификация качественных кадров • Основные принципы высокоэффективной команды • Виды стилей управления • Самые важные качества для руководства и подчинённых • Увеличение эффективности персонала

Преподаватели

Сапрыкин

Артур

ОБРАЗОВАТЕЛЬНАЯ АВТОНОМНАЯ НЕКОММЕРЧЕСКАЯ ОРГАНИЗАЦИЯ ВЫСШЕГО ОБРАЗОВАНИЯ "МОСКОВСКИЙ ТЕХНОЛОГИЧЕСКИЙ ИНСТИТУТ

Масягин

Игорь

ОБРАЗОВАТЕЛЬНАЯ АВТОНОМНАЯ НЕКОММЕРЧЕСКАЯ ОРГАНИЗАЦИЯ ВЫСШЕГО ОБРАЗОВАНИЯ "МОСКОВСКИЙ ТЕХНОЛОГИЧЕСКИЙ ИНСТИТУТ
Авторизуйтесь чтобы записаться

Ответственный за программу

ADragunova_fip@mail.ru

+7(999)4567936