Régression linéaire vs régression logistique
En analyse statistique, il est important d'identifier les relations entre les variables concernées par l'étude. Parfois, cela peut être le seul objectif de l'analyse elle-même. L'analyse de régression est un outil puissant utilisé pour établir l'existence d'une relation et l'identifier..
La forme la plus simple d'analyse de régression est la régression linéaire, où la relation entre les variables est une relation linéaire. En termes statistiques, cela met en évidence la relation entre la variable explicative et la variable de réponse. Par exemple, en utilisant la régression, nous pouvons établir la relation entre le prix des produits de base et la consommation sur la base de données recueillies à partir d'un échantillon aléatoire. L'analyse de régression produira une fonction de régression de l'ensemble de données, qui est un modèle mathématique qui correspond le mieux aux données disponibles. Cela peut facilement être représenté par un nuage de points. La régression graphique équivaut à rechercher la meilleure courbe d'ajustement pour l'ensemble de données donné. La fonction de la courbe est la fonction de régression. À l'aide du modèle mathématique, l'utilisation d'un produit peut être prédite pour un prix donné.
Par conséquent, l'analyse de régression est largement utilisée pour la prévision et la prévision. Il est également utilisé pour établir les relations dans les données expérimentales, dans les domaines de la physique, de la chimie et dans de nombreuses disciplines des sciences naturelles et de l'ingénierie. Si la relation ou la fonction de régression est une fonction linéaire, le processus s'appelle une régression linéaire. Dans le diagramme de dispersion, il peut être représenté par une ligne droite. Si la fonction n'est pas une combinaison linéaire des paramètres, la régression est non linéaire..
La régression logistique est comparable à la régression multivariée et crée un modèle pour expliquer l'impact de plusieurs prédicteurs sur une variable de réponse. Cependant, dans la régression logistique, la variable de résultat final doit être catégorique (généralement divisée; c’est-à-dire une paire de résultats possibles, comme la mort ou la survie, bien que des techniques spéciales permettent de modéliser des informations plus catégorisées). Une variable de résultat continue peut être transformée en une variable catégorique à utiliser pour la régression logistique; Toutefois, il est généralement déconseillé de regrouper des variables continues de cette manière, car cela réduit la précision..
Contrairement à la régression linéaire, vers la moyenne, les variables prédictives de la régression logistique ne doivent pas obligatoirement être reliées linéairement, communément distribuées ou avoir une variance égale à l'intérieur de chaque grappe. En conséquence, la relation entre le prédicteur et les variables de résultat ne sera probablement pas une fonction linéaire.
Quelle est la différence entre la régression logistique et linéaire?
• En régression linéaire, une relation linéaire entre la variable explicative et la variable de réponse est supposée et les paramètres satisfaisant le modèle sont trouvés par analyse, pour donner la relation exacte..
• La régression linéaire est effectuée pour les variables quantitatives et la fonction résultante est une analyse quantitative..
• Dans la régression logistique, les données utilisées peuvent être catégoriques ou quantitatives, mais le résultat est toujours catégorique..