Большие данные
ОБРАЗОВАТЕЛЬНАЯ АВТОНОМНАЯ НЕКОММЕРЧЕСКАЯ ОРГАНИЗАЦИЯ ВЫСШЕГО ОБРАЗОВАНИЯ "МОСКОВСКИЙ ТЕХНОЛОГИЧЕСКИЙ ИНСТИТУТ
Описание
Тема 1. Ведение в анализ больших данных. Обзор источников (12 ак. часов)
Основные определения. Задачи анализа больших данных. Вопросы безопасности.Понятие Data Mining. Когнитивный анализ данных. Обзор источников информации для Big Data (открытые источники информации, статистические сборники, опубликованные отчеты и результаты исследований; доступ к закрытой информации).Методики сбора данных.
Тема 2. Технологии хранения и обработки больших данных (10 ак. часов)
Конфигурации и профили в Java ME .Среды разработки, версии Java ME, профили MIDL 1 и 2, их отличительные особенности, требования к аппаратной среде. Мидлеты. Жизненный цикл мидлета. События высокого и низкого уровня; компоненты пользовательского интерфейса. Сборка и запуск сложных мидлетов. Компиляция, верификация, загрузка мидлета, отладка; сетевое взаимодействие, тонкие клиенты;
Тема 3. Статистические методы анализа (8 ак. часа)
Статистика. Параметрический метод. Непараметрический метод. Номинальные метод.
Тема 4. Современные программные средства анализа (10 ак. часов)
Обзор современных популярных программных средства анализа данных: Statistica, SPSS, Excel, R-Studio и другие;
Тема 5. Сбор и хранение больших данных (10 ак. часов)
Поиск источников информации в сети Интернет: открытые и закрытые источники данных Портал открытых данных РФ. Сохранение данных в программе Excel. Преобразование и первичная обработка данных.
Тема 6. Методы обработки и анализа больших данных (10 ак. часов)
Представление исходных данных в программе R-Studio (векторы, массивы, матрицы, списки, таблицы). Статистическая обработка данных в программах Excel и R-Studio: подсчет описательных статистик, графическое представление данных. Группировка данных, обнаружение значимых корреляций, зависимостей и тенденций в результате анализа имеющейся информации, выявления отношений между данными различного типа. Применение различных методов выделения, извлечения и группировки данных, которые позволяют выявить систематизированные структуры данных и вывести из них правила для принятия решений и прогнозирования их последствий (регрессионный, дисперсионный, кластерный, дискриминантный, факторный анализы).
Тема 7. Визуализация исходной информации и данных (10 ак. часов)
Возможности графического представления информации в программе R-Studio: графические функции отображения одномерных и многомерных данных, графический вывод с использованием графических параметров. Формирование команды. Стили управления.
Цель программы
Требования
- Предыдущее образование: высшее или среднее профессиональное
- Квалификация и опыт профессиональной деятельности: не имеют значения; специальной подготовки для прохождения программы не требуется
Иные требования и рекомендации для обучения по программе
- Предыдущее образование: высшее или среднее профессиональное
- Квалификация и опыт профессиональной деятельности: не имеют значения; специальной подготовки для прохождения программы не требуется
Модули
свернутьПреподаватели

Сапрыкин
Артур
ОБРАЗОВАТЕЛЬНАЯ АВТОНОМНАЯ НЕКОММЕРЧЕСКАЯ ОРГАНИЗАЦИЯ ВЫСШЕГО ОБРАЗОВАНИЯ "МОСКОВСКИЙ ТЕХНОЛОГИЧЕСКИЙ ИНСТИТУТ

Масягин
Игорь