spinner-it

Big Data

Старт навчання
Старт курсу запитуйте в адміністрації
36 год. по 2-3 рази на тиждень

Опис курсу

В результаті проходження курсу студенти опанують сучасні методи та алгоритми теорії інтелектуального аналізу великих даних та машинного навчання. Мета курсу — формування реальних навичок в аналізі, обробці, пошуці шаблонів та побудуванні прогнозів на основі даних.

Після курсу Ви зможете:

  • Аналізувати та обробляти великі та надвеликі дані у різних форматах з метою підтримки прийняття рішень
  • Знаходити шаблони у великих і надвеликих базах даних та у масивах тексту
  • Будувати прогнози з використанням сучасних методів і алгоритмів інтелектуального аналізу даних;
  • Використовувати програмне забезпечення для інтелектуального аналізу даних в практичній роботі.

Програма курсу:

  • 1. Загальні відомості про інтелектуальний аналіз даних (ІАД) та машинне навчання
    • Загальні відомості про великі данні та інтелектуальний аналіз даних. Задачі ІАД. Огляд методів ІАД та машинного навчання
    • Процес ІАД. Підготовлення даних.
    • Практичне застосування ІАД.
  • 2. Методи та алгоритми класифікації
    • Методи побудови дерев рішень. Методика «розділяй та володарюй». Алгоритм покриття. Алгоритм CART.
    • Байесівські методи класифікації.
    • Побудова математичних функції класифікації. Метод опорних векторів: лінійний та нелінійний випадки.
    • Системи з нечіткою логікою. Нечітко-нейронні системи. Настроювання параметрів нечітко-нейронних систем.
    • Розв’язання практичних задач класифікації.
  • 3. Методи та алгоритми кластеризації
    • Ієрархічна кластеризація: агломеративний та дівізимний алгоритми. Методи сусідства. Поняття дендрограми.
    • Статистичні алгоритми k-середніх, ЕМ та їх модифікації.
    • Методи кластеризації на основі теорії графів. Алгоритми знаходження мінімального покриваючого дерева. Алгоритм Борувки.
    • Алгоритм Форел та його модифікації.
    • Метод самоорганізуючих карт Кохонена. Метод стохастичного градієнта. Інтерпретація карт.
    • Аналіз результатів кластери-зації. Розв’язання практичних задач.
  • 4. Методи та алгоритми побудови асоціативних правил. Секвенційний аналіз
    • Загальні відомості. Показни-ки корисності асоціативних правил.
    • Алгоритми Apriori та FP-росту. Поняття FP-дерева (префіксного дерева).
    • Шаблони послідовностей. Алгоритм AprioriAll.
    • Пошук асоціативних правил в ієрархіях даних. Алгоритм GSP.
    • Розв’язання практичних задач пошуку асоціативних правил та шаблонів послідовностей.
  • 5. Ансамблі моделей ІАД
    • Види ансамблів. Поняття беггінгу. Суміш моделей ІАД. Комбінування результатів прогнозів, отриманих моделями ІАД.
    • Методи розрахунку коефіцієнтів відносних важливостей (ваг) моделей в ансамблі.
    • Поняття бустингу. Алгоритм AdaBoost. Обгрунтування бустингу. Градієнтний бустинг.
    • Порівняння моделей ІАД. Оцінки ефектив. та помилок моделей. Lift- і Profit-криві. ROC-аналіз.
  • 6. Методи та алгоритми аналізу текстової інформації (textmining)
    • Етапи text mining. Попередня обробка документів. Виявлення ключових понять. Анотування текстів.
    • Методи категоризації (рубрикації) текстів.
    • Методи пошуку релевантних документів на основі множини запитів. Методи навчання ранжуванню.
    • Розв’язання практичних задач text mining.

Мінімальні вимоги:

  • Дуже бажане (але не обов’язкове) володіння знаннями з теорії ймовірностей: дискретна та неперервна випадкова величина, математичне сподівання, дисперсія, умовне математичне сподівання;
  • Володіння на початковому рівні  мовою програмування Python.

* Примітка: зазначені знижки не сумуються з іншими діючими акціями та спеціальними пропозиціями. Знижка застосовується тільки до нових заявок та при умові повної оплати курсу. Якщо у Вас виникли питання, звертайтеся за консультацією до наших менеджерів!