Модуль 8

Инфраструктуры больших данных

Работа с кластерными системами и контейнеризация (Kubernetes, docker). Системы обработки и анализа больших массивов данных (Hadoop, Spark, ETL). Системы очередей и потоковая обработка данных (Spark Streaming, Apache Kafka). OLAP, Data Warehouse на основе ClickHouse.