Différence entre classification et régression

le différence clé entre la classification et l'arbre de régression est que dans la classification, les variables dépendantes sont catégoriques et non ordonnées, tandis que dans la régression, les variables dépendantes sont des valeurs entières continues ou ordonnées.

La classification et la régression sont des techniques d'apprentissage permettant de créer des modèles de prévision à partir des données collectées. Les deux techniques sont présentées graphiquement sous forme d'arbres de classification et de régression, ou plutôt d'organigrammes avec des divisions de données après chaque étape, ou plutôt de «branche» dans l'arbre. Ce processus s'appelle le partitionnement récursif. Des domaines tels que l'exploitation minière utilisent ces techniques d'apprentissage de classification et de régression. Cet article se concentre sur l’arbre de classification et l’arbre de régression..

CONTENU

1. Vue d'ensemble et différence clé
2. Qu'est-ce que la classification?
3. Qu'est-ce que la régression
4. Comparaison côte à côte - Classification vs régression sous forme tabulaire
5. Résumé

Qu'est-ce que la classification??

La classification est une technique utilisée pour obtenir un schéma qui montre l'organisation des données en commençant par une variable précurseur. Les variables dépendantes sont ce que classer les données.

Figure 01: Exploration de données

L'arbre de classification commence par la variable indépendante, qui se divise en deux groupes comme déterminé par les variables dépendantes existantes. Il est destiné à élucider les réponses sous la forme de catégorisation provoquée par les variables dépendantes.

Qu'est-ce que la régression

La régression est une méthode de prédiction basée sur une valeur de sortie numérique supposée ou connue. Cette valeur de sortie est le résultat d'une série de partitions récursives, chaque étape ayant une valeur numérique et un autre groupe de variables dépendantes qui se ramifient vers une autre paire telle que celle-ci..

L'arbre de régression commence par une ou plusieurs variables précurseurs et se termine par une variable de sortie finale. Les variables dépendantes sont des variables numériques continues ou discrètes.

Quelle est la différence entre classification et régression?

 Classification vs régression

Un modèle d'arborescence dans lequel la variable cible peut prendre un ensemble discret de valeurs. Un modèle arborescent dans lequel la variable cible peut prendre des valeurs continues, généralement des nombres réels.
Variable dépendante
Pour l'arbre de classification, les variables dépendantes sont catégoriques. Pour l'arbre de régression, les variables dépendantes sont numériques.
Valeurs
A une quantité définie de valeurs non ordonnées. A des valeurs discrètes mais ordonnées ou des valeurs indiscrètes.
But de la construction
Le but de la construction de l’arbre de régression est d’adapter un système de régression à chaque branche déterminante de manière à ce que la valeur de sortie attendue apparaisse.. Une arborescence de classification se branche comme déterminé par une variable dépendante dérivée du noeud précédent.

Résumé - classification vs régression

Les arbres de régression et de classification sont des techniques utiles pour cartographier le processus qui pointe vers un résultat étudié, qu'il s'agisse d'une classification ou d'une valeur numérique unique. La différence entre l'arbre de classification et l'arbre de régression est leur variable dépendante. Les arbres de classification ont des variables dépendantes qui sont catégoriques et non ordonnées. Les arbres de régression ont des variables dépendantes qui sont des valeurs continues ou des valeurs entières ordonnées.

Référence:

1. «Apprentissage de l'arbre de décision». Wikipédia, Wikimedia Foundation, 13 mai 2018. Disponible ici 

Courtoisie d'image:

1.'Data Mining'By Arbeck - Travail personnel, (CC PAR 3.0) ventre autres Wikimedia Commons