SPARK: Анализ данных с помощью современного Apache Spark

Продолжительность: 4 дня, 32 академических часа
Соотношение теории к практике 40/60
Практический курс «Анализ данных с помощью современного Apache Spark» представляет собой 4-дневный интенсивный тренинг по использованию распределенной платформы Apache Spark для работы с большими массивами данных, в том числе — неструктурированных , и потоковой обработки информации.
Обучение Спарк содержит теоретический минимум, необходимый для эффективного использования всех компонентов Apache Spark (Spark Core, Spark Streaming, Spark SQL, ML и GraphX) для пакетной и потоковой обработки данных. Практическая часть включает запуск и настройку компонентов, работу в среде Jupyter Notebook, прикладное использование Спарк для разработки собственных распределенных приложений пакетной и потоковой обработки информации и анализа больших данных.