spinner-it

Apache Spark Training

Огляд послуги

Послуга призначена для отримання знань і практичних навичок в області Spark

Цілі послуги

В результаті надання даної послуги, слухачі повинні будуть:

  • Мати уявлення про Apache Spark:
  • Порівняння з класичним MapReduce
  • Архітектура
  • Варіанти розгортання і запуску
  • Основи Аналітики Apache Spark
  • Оптимізація продуктивності в Spark
  • Мати уявлення про середовище Apache Zeppelin
  • Відрізняти версії в різних дистрибутивах
  • Мати уявлення про RDD
  • Ознайомлення з перевагами Lazy Evaluation
  • Мати уявлення про Spark SQL
  • Використання різних джерел даних до Spark SQL
  • Розподілена обробка з DataFrame
  • Відрізняти DataFrame від RDD
  • Ознайомлення з основними операціями з DataFrame
  • Мати уявлення про Spark Streaming
  • Обробка потокових Даних за допомогою DStreams
  • Застосування трансформацій і дій до DStreams
  • Віконні функції в Spark Streaming

Проведуть ряд практичних робіт:

  • "Запуск Spark завдання за допомогою Spark shell"
  • "Запуск Spark завдання за допомогою Apache Zeppelin і візуалізація результатів"
  • "Запуск основних трансформацій і дій за допомогою Apache Zeppelin"
  • "Рішення завдання аналізу чеків з використанням RDD в Spark"
  • "Запуск основних операцій Spark SQL"
  • "Рішення завдання аналізу чеків з використанням SparkSQL"
  • "Рішення завдання аналізу потокових даних з використанням Spark Streaming"

Вимоги до рівня підготовки:   Мінімальні навички SQL, бажані початкові знання мови Java, а також досвід роботи в ОС Linux на рівні досвідченого користувача

Запис на курс

Код курсуTD APAST
Тривалість2д (16ч)
Код екзамену
Вартість без ПДВ36 700 грн.

У зв'язку з карантином всі наші курси читаються у online-форматі.