spinner-it

Курс Big Data у Києві

Курс Big Data

Старт навчання
Старт курсу запитуйте в адміністрації
36 год. по 2-3 рази на тиждень

Опис курсу

В результаті проходження курсу студенти опанують сучасні методи та алгоритми теорії інтелектуального аналізу великих даних та машинного навчання.

— 

Мета курсу — формування реальних навичок в аналізі, обробці, пошуку шаблонів та побудуванні прогнозів на основі даних.

Після курсу Ви зможете:

  • Аналізувати та обробляти великі та надвеликі дані у різних форматах з метою підтримки прийняття рішень
  • Знаходити шаблони у великих і надвеликих базах даних та у масивах тексту
  • Будувати прогнози з використанням сучасних методів і алгоритмів інтелектуального аналізу даних;
  • Використовувати програмне забезпечення для інтелектуального аналізу даних в практичній роботі.

Дивитись роботи випускників

Програма курсу:


1. Загальні відомості про інтелектуальний аналіз даних (ІАД) та машинне навчання

  • Загальні відомості про великі дані та інтелектуальний аналіз даних. Задачі ІАД. Огляд методів ІАД та машинного навчання
  • Процес ІАД. Підготовлення даних.
  • Практичне застосування ІАД.

2. Методи та алгоритми класифікації

  • Методи побудови дерев рішень. Методика «розділяй та володарюй». Алгоритм покриття. Алгоритм CART.
  • Байесівські методи класифікації.
  • Побудова математичних функцій класифікації. Метод опорних векторів: лінійний та нелінійний випадки.
  • Системи з нечіткою логікою. Нечітко-нейронні системи. Настроювання параметрів нечітко-нейронних систем.
  • Розв’язання практичних задач класифікації.

3. Методи та алгоритми кластеризації

  • Ієрархічна кластеризація: агломеративний та дівізимний алгоритми. Методи сусідства. Поняття дендрограми.
  • Статистичні алгоритми k-середніх, ЕМ та їх модифікації.
  • Методи кластеризації на основі теорії графів. Алгоритми знаходження мінімального покриваючого дерева. Алгоритм Борувки.
  • Алгоритм Форел та його модифікації.
  • Метод самоорганізуючих карт Кохонена. Метод стохастичного градієнта. Інтерпретація карт.
  • Аналіз результатів кластери-зації. Розв’язання практичних задач.

4. Методи та алгоритми побудови асоціативних правил. Секвенційний аналіз

  • Загальні відомості. Показники корисності асоціативних правил.
  • Алгоритми Apriori та FP-росту. Поняття FP-дерева (префіксного дерева).
  • Шаблони послідовностей. Алгоритм AprioriAll.
  • Пошук асоціативних правил в ієрархіях даних. Алгоритм GSP.
  • Розв’язання практичних задач пошуку асоціативних правил та шаблонів послідовностей.

5. Ансамблі моделей ІАД

  • Види ансамблів. Поняття беггінгу. Суміш моделей ІАД. Комбінування результатів прогнозів, отриманих моделями ІАД.
  • Методи розрахунку коефіцієнтів відносних важливостей (ваг) моделей в ансамблі.
  • Поняття бустингу. Алгоритм AdaBoost. Обґрунтування бустингу. Градієнтний бустинг.
  • Порівняння моделей ІАД. Оцінки ефективності та помилок моделей. Lift- і Profit-криві. ROC-аналіз.

6. Методи та алгоритми аналізу текстової інформації (textmining)

  • Етапи text mining. Попередня обробка документів. Виявлення ключових понять. Анотування текстів.
  • Методи категоризації (рубрикації) текстів.
  • Методи пошуку релевантних документів на основі множини запитів. Методи навчання ранжуванню.
  • Розв’язання практичних задач text mining.

Мінімальні вимоги:

  • Дуже бажане (але не обов’язкове) володіння знаннями з теорії ймовірностей: дискретна та неперервна випадкова величина, математичне сподівання, дисперсія, умовне математичне сподівання;
  • Володіння на початковому рівні  мовою програмування Python.

* Примітка: зазначені знижки не сумуються з іншими діючими акціями та спеціальними пропозиціями. Знижка застосовується тільки до нових заявок та при умові повної оплати курсу. Якщо у Вас виникли питання, звертайтеся за консультацією до наших менеджерів!

У зв'язку з карантином всі наші курси читаються у online-форматі.