Variance vs Covariance
La variance et la covariance sont deux mesures utilisées dans les statistiques. La variance est une mesure de la dispersion des données et la covariance indique le degré de changement de deux variables aléatoires ensemble. La variance est plutôt un concept intuitif, mais la covariance est définie mathématiquement de manière peu intuitive au premier abord..
En savoir plus sur la variance
La variance est une mesure de la dispersion des données à partir de la valeur moyenne de la distribution. Il indique la distance entre les points de données et la moyenne de la distribution. C'est l'un des principaux descripteurs de la distribution de probabilité et l'un des moments de la distribution. De plus, la variance est un paramètre de la population et la variance d'un échantillon de la population sert d'estimateur de la variance de la population. D'un point de vue, il est défini comme le carré de l'écart type.
En langage clair, cela peut être décrit comme la moyenne des carrés de la distance entre chaque point de données et la moyenne de la distribution. La formule suivante est utilisée pour calculer la variance.
Var (X) = E [(X-µ)2 ] pour une population, et
Var (X) = E [(X-‾x)2 ] pour un échantillon
Il peut encore être simplifié de donner Var (X) = E [X2 ]-(EX])2.
Variance a certaines propriétés de signature et est souvent utilisé dans les statistiques pour simplifier l'utilisation. La variance est non négative car c'est le carré des distances. Cependant, la plage de la variance n'est pas limitée et dépend de la distribution particulière. La variance d'une variable aléatoire constante est égale à zéro et la variance ne change pas par rapport à un paramètre d'emplacement..
En savoir plus sur Covariance
En théorie statistique, la covariance est une mesure du degré de modification simultanée de deux variables aléatoires. En d'autres termes, la covariance est une mesure de la force de la corrélation entre deux variables aléatoires. En outre, il peut être considéré comme une généralisation du concept de variance de deux variables aléatoires.
La covariance de deux variables aléatoires X et Y, qui sont distribuées conjointement avec un deuxième moment fini, est appelée σXY= E [(X-E [X]) (Y-E [Y])]. À partir de là, la variance peut être considérée comme un cas particulier de covariance, où deux variables sont identiques. Cov (X, X) = Var (X)
En normalisant la covariance, on peut obtenir le coefficient de corrélation linéaire ou le coefficient de corrélation de Pearson, défini par ρ = E [(X-E [X]) (Y-E [Y])] / (σX σY ) = (Cov (X, Y)) / (σX σY)
Graphiquement, la covariance entre une paire de points de données peut être vue comme la surface du rectangle avec les points de données aux sommets opposés. Cela peut être interprété comme une mesure de la magnitude de la séparation entre les deux points de données. Considérant les rectangles pour l'ensemble de la population, le chevauchement des rectangles correspondant à tous les points de données peut être considéré comme la force de la séparation; variance des deux variables. La covariance est en deux dimensions, à cause de deux variables, mais la simplifier en une variable donne la variance d'une seule comme la séparation dans une dimension.
Quelle est la difference entre Variance et Covariance?
• La variance est la mesure de la dispersion / dispersion dans une population, tandis que la covariance est considérée comme une mesure de la variation de deux variables aléatoires ou de la force de la corrélation..
• La variance peut être considérée comme un cas particulier de covariance.
• La variance et la covariance dépendent de la magnitude des valeurs des données et ne peuvent être comparées. par conséquent, ils sont normalisés. La covariance est normalisée dans le coefficient de corrélation (en divisant par le produit des écarts-types des deux variables aléatoires) et la variance est normalisée dans l'écart-type (en prenant la racine carrée)