На відміну від логістичної та лінійної регресії, CART не розробляє рівняння прогнозування. Натомість дані поділяються вздовж осей предикторів на підмножини з однорідними значеннями залежної змінної — процес, представлений деревом рішень, яке можна використовувати для прогнозування на основі нових спостережень. 1 серпня 2017 р.
Термін CART служить загальним терміном для наступних категорій дерев рішень: Дерева класифікації: Дерево використовується для визначення того, до якого «класу» цільова змінна найімовірніше потрапить, коли вона є безперервною. Дерева регресії: вони використовуються для прогнозування значення безперервної змінної.
На відміну від методів лінійної регресії, Аналіз CART не передбачає певної форми зв’язку між незалежними та залежними змінними. Тому CART часто можна використовувати навіть у випадках, коли дані не підходять для аналізу за допомогою лінійної регресії.
Використовуйте CART ® Regression, щоб створити дерево рішень для безперервної відповіді з багатьма категоріальними та безперервними змінними предикторів. CART ® Regression ілюструє важливі закономірності та взаємозв’язки між безперервною відповіддю та важливими предикторами в дуже складних даних без використання параметричних методів.
Основна відмінність між логістичною регресією та деревами рішень полягає в тому, що логістична регресія моделює зв’язок між змінними прогнозу та змінною результату як лінійну функцію, тоді як дерева рішень створюють ієрархічну структуру дерева для моделювання зв’язків між змінними.
Переваги
- Доступні всі типи відповідей – категоричні та суцільні.
- Легко обробляйте крайні викиди та багато відсутніх значень.
- Ідеально підходить для великих наборів даних.
- Немає необхідності дотримуватися будь-яких припущень, оскільки це непараметричний метод.
- Результат простий для розуміння та інтерпретації.