Рецоммендед, 2020

Избор Уредника

Разлика између класификације и регресије

Класификација и регресија су два главна проблема предвиђања који се обично обрађују у Дата мининг-у. Предиктивно моделирање је техника развијања модела или функције користећи повијесне податке за предвиђање нових података. Значајна разлика између класификације и регресије је да класификација мапира објекат улазних података на неке дискретне ознаке. Са друге стране, регресија мапира објекат улазних података на континуалне реалне вредности.

Цомпарисон Цхарт

Основа за поређењеКласификацијаРегресија
Басиц
Откривање модела или функција где се мапирање објеката врши у унапред дефинисаним класама.Израђен модел у којем се мапирање објеката врши у вриједности.
Укључује предвиђањеДискретне вредностиЦонтинуоус валуес
АлгоритмиСтабло одлучивања, логистичка регресија, итд.Регресијско дрво (случајна шума), линеарна регресија, итд.
Природа предвиђених податакаУнордередНаређено
Метод обрачунаТачност мерењаМерење грешке средњег квадрата

Дефиниција класификације

Класификација је процес проналажења или откривања модела (функције) који помаже у раздвајању података у вишеструке категоријске класе. Код класификације, идентификује се групно чланство у проблему, што значи да се подаци категоризују под различитим ознакама према неким параметрима и онда се ознаке предвиђају за податке.

Изведени модели се могу демонстрирати у облику “ИФ-ТХЕН” правила, стабла одлучивања или неуронских мрежа, итд. Стабло одлучивања је фундаментално дијаграм тока који подсјећа на структуру стабла гдје сваки интерни чвор приказује тест на атрибуту, и његове гране показују исход теста. Процес класификације бави се проблемима у којима се подаци могу подијелити на двије или више дискретних ознака, другим ријечима, двије или више неповезаних скупова.

Узмимо примјер, претпоставимо да желимо предвидјети могућност кише у неким регијама на основу неких параметара. Тада би постојале двије ознаке за кишу и без кише под којом се могу класифицирати различити региони.

Дефиниција регресије

Регресија је процес проналажења модела или функције за разликовање података у континуираним стварним вриједностима умјесто кориштења класа. Математички, са проблемом регресије, покушава се пронаћи апроксимација функције са минималним одступањем грешке. У регресији се предвиђа да ће се бројчана зависност података разликовати.

Регресиона анализа је статистички модел који се користи за предвиђање нумеричких података уместо ознака. Такође може да идентификује кретање дистрибуције у зависности од доступних података или историјских података.

Узмимо сличан примјер у регресији, гдје налазимо могућност кише у неким одређеним регијама уз помоћ неких параметара. У овом случају постоји вероватноћа повезана са кишом. Овде не класификујемо регионе у оквиру кише и нема ознака за кишу, већ их класификујемо са њиховом вероватноћом.

Кључне разлике између класификације и регресије

  1. Процес класификације моделира функцију кроз коју се подаци предвиђају у дискретним класним ознакама. С друге стране, регресија је процес стварања модела који предвиђа континуирану количину.
  2. Алгоритми класификације укључују стабло одлучивања, логистичку регресију, итд. Насупрот томе, регресијско дрво (нпр. Случајна шума) и линеарна регресија су примјери регресионих алгоритама.
  3. Класификација предвиђа неуређене податке, док регресија предвиђа наручене податке.
  4. Регресија се може проценити коришћењем грешке средњег квадрата. Напротив, класификација се оцјењује прецизношћу мјерења.

Закључак

Техника класификације обезбеђује предиктивни модел или функцију која предвиђа нове податке у дискретним категоријама или ознакама уз помоћ историјских података. Насупрот томе, методом регресије моделирају се функције континуираног вредновања, што значи да предвиђа податке у континуираним нумеричким подацима.

Top