Apache Spark Training

Обзор услуги

Услуга предназначена для получения знаний и практических навыков в области Spark  

Цели услуги

В результате предоставления данной услуги, слушатели должны будут:
  • Иметь представление о Apache Spark:
  • Сравнение с классическим MapReduce
  • Архитектура
  • Варианты развертывания и запуска
  • Основы аналитики Apache Spark
  • Оптимизация производительности в Spark
  • Иметь представление о среде Apache Zeppelin
  • Отличать версиии в различных дистрибутивах
  • Иметь представление о RDD
  • Ознакомление с преимуществами Lazy Evaluation.
  • Иметь представление о Spark SQL
  • Использование различных источников данных в Spark SQL
  • Распределенная обработка с DataFrame
  • Отличать DataFrame от RDD
  • Ознакомление с основными операциями с DataFrame
  • Иметь представление о Spark Streaming
  • Обработка потоковых данных с помощью DStreams
  • Применение трансформаций и действий к DStreams
  • Оконные функции в Spark Streaming
Проведут ряд практических работ:
  • "Запуск Spark задачи с помощью Spark shell"
  • "Запуск Spark задачи с помощью Apache Zeppelin и визуализация результатов"
  • "Запуск основных трансформаций и действий с помощью Apache Zeppelin"
  • "Решение задачи анализа чеков с использованием RDD в Spark"
  • "Запуск основных операций Spark SQL"
  • "Решение задачи анализа чеков с использованием SparkSQL"
  • "Решение задачи анализа потоковых данных с использованием Spark Streaming"
Требования к уровню подготовки:
  • Минимальные навыки SQL, желательны начальные знания языка Java, а также опыт работы в ОС Linux на уровне продвинутого пользователя

Запись на курс

Код курсаTD APAST
Длительность2д (16ч)
Код экзамена
Стоимость без НДС36 700 грн.