Moyenne vs médiane vs mode
La moyenne, la médiane et le mode sont les principaux mesures de tendance centrale utilisé dans les statistiques descriptives. Ils sont complètement différents les uns des autres et les cas dans lesquels ils sont utilisés pour résumer les données sont également différents.
Signifier
La moyenne arithmétique est la somme des valeurs de données divisée par le nombre de valeurs de données, c.-à-d..
Si les données proviennent d’un espace échantillon, on parle de moyenne d’échantillon (), qui est une statistique descriptive de l’échantillon. Bien qu'il s'agisse de la mesure descriptive la plus couramment utilisée pour un échantillon, il ne s'agit pas d'une statistique robuste. Il est très sensible aux valeurs aberrantes et aux oscillations.
Par exemple, considérons le revenu moyen des citoyens d’une ville donnée. Comme toutes les valeurs de données sont additionnées puis divisées, le revenu d'une personne extrêmement riche influe considérablement sur la moyenne. Par conséquent, les valeurs moyennes ne représentent pas toujours bien les données..
De même, dans le cas d'un signal alternatif, le courant traversant un élément varie périodiquement du sens positif au sens négatif et inversement. Si nous prenons le courant moyen traversant l'élément au cours d'une seule période, cela donnera un 0, ce qui signifie qu'aucun courant n'est passé à travers l'élément, ce qui n'est évidemment pas vrai. Par conséquent, dans ce cas aussi, la moyenne arithmétique n’est pas une bonne mesure.
La moyenne arithmétique est un bon indicateur lorsque les données sont distribuées uniformément. Pour une distribution normale, la moyenne est égale au mode et à la médiane. Il a également les résidus les plus bas en considérant l'erreur quadratique moyenne racine; par conséquent, la meilleure mesure descriptive lorsqu'il est nécessaire de représenter un jeu de données par un nombre unique.
Médian
Les valeurs du point de données médian après avoir classé toutes les valeurs de données dans l'ordre croissant sont définies comme la médiane de l'ensemble de données. La médiane est le 2e quartile, le 5e décile et le 50e centile..
• Si le nombre d'observations (points de données) est impair, la médiane est l'observation située exactement au milieu de la liste ordonnée..
• Si le nombre d'observations (points de données) est pair, la médiane est la moyenne des deux observations du milieu dans la liste ordonnée..
La médiane divise l'observation en deux groupes; c'est-à-dire un groupe (50%) de valeurs supérieures et un groupe (50%) de valeurs inférieures à la médiane. Les médianes sont spécifiquement utilisées dans les distributions asymétriques et représentent les données assez mieux que la moyenne arithmétique.
Mode
Mode est le nombre le plus fréquent dans un ensemble d'observations. Le mode d'un ensemble de données est calculé en recherchant la fréquence de chaque élément de l'ensemble.
• Si aucune valeur n'apparaît plus d'une fois, le jeu de données n'a pas de mode.
• Sinon, toute valeur ayant la plus grande fréquence est un mode du jeu de données.
Plus d'un mode peut exister dans un ensemble; Par conséquent, le mode n'est pas une statistique unique d'un ensemble de données. Dans une distribution uniforme, il y a un mode. Le mode d'une distribution de probabilité discrète est le point où la fonction de masse de probabilité atteint son point le plus élevé. Rendu à partir des interprétations ci-dessus, on peut dire que maxima globaux sont des modes.
Examiner l'application des trois mesures à l'ensemble de données suivant.
DONNÉES: 1, 1, 2, 3, 5, 5, 5, 6, 6, 8, 8, 9, 9, 9, 9, 10, 10, 10, 10, 14, 14, 15, 15 , 15
Moyenne = (1+ 1+ 2+ 3+ 5+ 5+ 5+ 6+ 6+ 8+ 9+ 9+ 9+ 9+ 10+ 10+ 10+ 14+ 15+ 15+ 15+ ) / 25 = 8,12
Médiane = 9 (13ème élément)
Mode = 9 (fréquence de 9 = 5)
Quelle est la différence entre moyenne, médiane et mode?
• La moyenne arithmétique est la somme des valeurs (observations) divisées par le nombre d'observations. Ce n'est pas une statistique robuste et dépend fortement de la nature de la distribution normale dans la distribution considérée. Une seule valeur aberrante peut entraîner un changement significatif de la moyenne, ce qui donne des valeurs relativement trompeuses. Le concept peut être étendu à la moyenne géométrique, moyenne harmonique, moyenne pondérée, etc..
• La médiane est la valeur médiane de l'ensemble d'observations et est relativement moins affectée par les valeurs aberrantes. Cela peut donner une bonne estimation car la statistique sommaire dans les cas très asymétriques.
• Mode est la valeur d'observation la plus courante dans le jeu de données. Si la distribution est asymétrique positive, le mode est laissé à la médiane et, s'il est faussement négatif, le mode est situé à la médiane.
• Si positivement asymétrique, la moyenne a raison de la médiane; si la moyenne asymétrique est à gauche de la médiane.
• Dans la distribution normale, les trois moyennes, mode et médiane sont égales.