introduction
la norme rééviation (SD) et Standard Ele pire (SE) sont des terminologies apparemment similaires; Cependant, ils sont si variés sur le plan conceptuel qu'ils sont presque indifféremment utilisés dans la littérature statistique. Les deux termes sont généralement précédés d'un symbole plus-moins (+/-), ce qui indique qu'ils définissent une valeur symétrique ou représentent une plage de valeurs. Invariablement, les deux termes apparaissent avec une moyenne (moyenne) d'un ensemble de valeurs mesurées.
Fait intéressant, une SE n’a rien à voir avec les normes, les erreurs ou la communication de données scientifiques..
Un examen détaillé de l’origine et de l’explication de SD et de SE révélera pourquoi les statisticiens professionnels et ceux qui l’utilisent de manière superficielle tendent à se tromper.
Déviation standard (SD)
Un SD est un descriptif statistique décrivant la propagation d'une distribution. En tant que métrique, il est utile lorsque les données sont normalement distribuées. Cependant, il est moins utile lorsque les données sont fortement asymétriques ou bimodales, car elles ne décrivent pas très bien la forme de la distribution. En règle générale, nous utilisons le DD pour consigner les caractéristiques de l’échantillon, car nous avons l’intention de décrire combien les données varient autour de la moyenne. D'autres statistiques utiles pour décrire la dispersion des données sont l'intervalle inter-quartile, les 25e et 75e centiles et l'étendue des données..
Figure 1. La SD est une mesure de la dispersion des données. Lorsque les données sont un échantillon d’une distribution normalement distribuée, on s’attend à ce que les deux tiers des données se situent dans les limites de 1 écart type de la moyenne..
La variance est un descriptif La statistique aussi, et elle est définie comme le carré de l’écart type. Il n’est généralement pas rapporté lors de la description des résultats, mais c’est une formule plus mathématiquement traitable (par exemple, la somme des écarts carrés) et joue un rôle dans le calcul des statistiques..
Par exemple, si nous avons deux statistiques P Et Q avec des variances connues var(P) Et var(Q), alors la variance de la somme P + Q est égal à la somme des variances: var(P) +var(Q). Pourquoi les statisticiens aiment-ils parler de variances?.
Mais les écarts-types ont une signification importante en termes de propagation, en particulier lorsque les données sont distribuées normalement: La moyenne de l’intervalle +/ - 1 SD On peut s’attendre à ce qu’il capture les deux tiers de l’échantillon et la moyenne de l’intervalle. +- 2 SD On peut s’attendre à ce qu’il capture 95% de l’échantillon.
Le DD fournit une indication de la mesure dans laquelle les réponses individuelles à une question varient ou «s'écartent» de la moyenne. SD indique au chercheur à quel point les réponses sont dispersées: sont-elles concentrées autour de la moyenne ou dispersées? Est-ce que tous vos répondants ont classé votre produit au milieu de votre échelle, ou est-ce que certains l'ont approuvé et d'autres l'ont désapprouvé??
Prenons une expérience dans laquelle on demande aux personnes interrogées d’évaluer un produit sur une série d’attributs sur une échelle de 5 points. La moyenne pour un groupe de dix répondants (étiquetés de «A» à «J» ci-dessous) pour «bon rapport qualité-prix» était de 3,2 avec un écart-type de 0,4 et la moyenne pour la «fiabilité du produit» était de 3,4 avec un écart-type de 2,1..
À première vue (ne regardant que les moyens), il semblerait que la fiabilité ait été jugée supérieure à la valeur. Cependant, le niveau de sécurité élevé pour la fiabilité pourrait indiquer (comme le montre la distribution ci-dessous) que les réponses étaient très polarisées, la plupart des répondants n’ayant pas de problème de fiabilité (attribut 5), alors qu’un segment plus petit mais important de répondants un problème de fiabilité et noté l'attribut «1». Regarder la moyenne seule ne raconte qu’une partie de l’histoire, mais le plus souvent, c’est ce sur quoi les chercheurs se concentrent. Il est important de prendre en compte la distribution des réponses et le DS fournit une mesure descriptive précieuse de cette.
Intimé | Bon rapport qualité prix | Fiabilité du produit |
UNE | 3 | 1 |
B | 3 | 1 |
C | 3 | 1 |
ré | 3 | 1 |
E | 4 | 5 |
F | 4 | 5 |
g | 3 | 5 |
H | 3 | 5 |
je | 3 | 5 |
J | 3 | 5 |
Signifier | 3.2 | 3.4 |
Std. Dev. | 0.4 | 2.1 |
Première enquête: les répondants évaluent un produit sur une échelle de 5 points
Deux distributions très différentes de réponses à une échelle d'évaluation à 5 points peuvent donner la même moyenne. Prenons l'exemple suivant montrant les valeurs de réponse pour deux évaluations différentes..
Dans le premier exemple (Note «A»), SD est égal à zéro car TOUTES les réponses correspondaient exactement à la valeur moyenne. Les réponses individuelles ne s'écartaient pas du tout de la moyenne.
Dans la note «B», même si la moyenne du groupe est la même (3,0) que la première distribution, l’écart type est plus élevé. L’écart type de 1,15 montre que les réponses individuelles, en moyenne *, étaient à un peu plus d’un point de la moyenne.
Intimé | Note «A» | Note «B» |
UNE | 3 | 1 |
B | 3 | 2 |
C | 3 | 2 |
ré | 3 | 3 |
E | 3 | 3 |
F | 3 | 3 |
g | 3 | 3 |
H | 3 | 4 |
je | 3 | 4 |
J | 3 | 5 |
Signifier | 3.0 | 3.0 |
Std. Dev. | 0.00 | 1,15 |
Deuxième enquête: les répondants évaluent un produit sur une échelle de 5 points
Une autre façon de voir le développement durable consiste à représenter graphiquement la distribution sous forme d'histogramme de réponses. Une distribution avec une SD faible afficherait une forme haute et étroite, tandis qu'une SD large serait indiquée par une forme plus large.
En règle générale, le DD n'indique pas «bon ou mauvais» ni «meilleur ou pire» - un SD moins élevé n'est pas nécessairement plus souhaitable. Il est utilisé purement comme une statistique descriptive. Il décrit la distribution par rapport à la moyenne.
TClause de non-responsabilité technique relative au DD
Considérer le DD comme un «écart moyen» est un excellent moyen de comprendre conceptuellement sa signification. Cependant, il n'est pas réellement calculé comme une moyenne (sinon, nous l'appellerions «l'écart moyen»). Au lieu de cela, il est «normalisé», une méthode assez complexe de calcul de la valeur en utilisant la somme des carrés.
Pour des raisons pratiques, le calcul n'est pas important. La plupart des programmes de tabulation, feuilles de calcul ou autres outils de gestion de données calculent le DD pour vous. Plus important est de comprendre ce que les statistiques véhiculent.
Erreur standard
Une erreur standard est un inférentielle statistique utilisée lors de la comparaison des moyennes d'échantillon (moyennes) d'une population à l'autre. C'est une mesure de précision de la moyenne de l'échantillon. La moyenne d'échantillon est une statistique dérivée de données ayant une distribution sous-jacente. Nous ne pouvons pas le visualiser de la même manière que les données, car nous avons effectué une seule expérience et n'avons qu'une seule valeur. La théorie statistique nous dit que la moyenne de l'échantillon (pour un grand échantillon «suffisant» et dans quelques conditions de régularité) est approximativement normalement distribuée. L’écart type de cette distribution normale est ce que nous appelons l’erreur type.
Figure 2. La distribution en basindique la distribution des données, tandis que la distribution au sommet est la distribution théorique de la moyenne de l’échantillon. Le SD de 20 est une mesure de la dispersion des données, tandis que le SE de 5 est une mesure de l'incertitude autour de la moyenne de l'échantillon..
Lorsque nous voulons comparer les moyennes des résultats d'une expérience à deux échantillons du traitement A par rapport au traitement B, nous devons ensuite estimer la précision avec laquelle nous avons mesuré les moyennes..
En fait, nous sommes intéressés par la précision avec laquelle nous avons mesuré la différence entre les deux moyennes. Nous appelons cette mesure l'erreur type de la différence. Vous ne serez peut-être pas surpris d'apprendre que l'erreur-type de la différence entre les moyennes d'échantillon est fonction des erreurs-types de la moyenne:
Maintenant que vous avez compris que l’erreur type de la moyenne (SE) et l’écart type de la distribution (SD) sont deux animaux différents, vous vous demandez peut-être comment ils se sont confondus. Même s’ils diffèrent sur le plan conceptuel, ils ont mathématiquement une relation simple:
,où n est le nombre de points de données.
Notez que l'erreur type dépend de deux composants: l'écart type de l'échantillon et la taille de l'échantillon. n. Cela a un sens intuitif: plus l’écart-type de l’échantillon est grand, moins nous pouvons être précis dans notre estimation de la moyenne vraie..
En outre, plus la taille de l'échantillon est grande, plus nous disposons d'informations sur la population et plus nous pouvons estimer avec précision la moyenne réelle..
SE est une indication de la fiabilité de la moyenne. Une petite SE est une indication que la moyenne de l'échantillon est un reflet plus précis de la moyenne de la population réelle. Une taille d'échantillon plus grande donnera normalement un SE plus petit (bien que la taille de l'échantillon ne soit pas directement affectée par la taille de l'échantillon).
La plupart des sondages consistent à tirer un échantillon d’une population. Nous faisons ensuite des déductions sur la population à partir des résultats obtenus à partir de cet échantillon. Si un deuxième échantillon a été tiré, les résultats ne correspondront probablement pas exactement au premier échantillon. Si la valeur moyenne pour un attribut de notation était de 3,2 pour un échantillon, elle pourrait être de 3,4 pour un deuxième échantillon de la même taille. Si nous devions tirer un nombre infini d'échantillons (de taille égale) de notre population, nous pourrions afficher les moyennes observées sous forme de distribution. Nous pourrions ensuite calculer une moyenne de toutes les moyennes de notre échantillon. Cette moyenne serait égale à la moyenne de la population réelle. Nous pouvons également calculer le SD de la distribution des moyennes d'échantillon. Le SD de cette distribution de moyennes d'échantillon est le SE de chaque moyenne d'échantillon individuel.
Nous avons donc notre observation la plus significative: SE est la moyenne SD de la population.
Échantillon | Signifier |
1er | 3.2 |
2ème | 3.4 |
3ème | 3.3 |
4ème | 3.2 |
5ème | 3.1 |
… . | … . |
… . | … . |
… . | … . |
… . | … . |
… . | … . |
Signifier | 3.3 |
Std. Dev. | 0,13 |
Tableau illustrant la relation entre SD et SE
Il est maintenant clair que si le SD de cette distribution nous aide à comprendre à quel point une moyenne d'échantillon est éloignée de la moyenne réelle de la population, nous pouvons utiliser cette information pour comprendre la précision d'une moyenne d'échantillon individuel par rapport à la moyenne réelle. C'est l'essence de la SE.
En réalité, nous n'avons tiré qu'un seul échantillon de notre population, mais nous pouvons utiliser ce résultat pour fournir une estimation de la fiabilité de la moyenne de notre échantillon observé..
En fait, SE nous dit que nous pouvons être sûrs à 95% que la moyenne de notre échantillon observé est d'environ 2 (en fait, 1,96). Erreurs-types de la moyenne de la population.
Le tableau ci-dessous montre la distribution des réponses de notre premier (et unique) échantillon utilisé pour notre recherche. La SE de 0,13, étant relativement petite, nous indique que notre moyenne est relativement proche de la moyenne réelle de notre population globale. La marge d'erreur (à 95% de confiance) de notre moyenne est (environ) le double de cette valeur (+/- 0,26), nous indiquant que la moyenne réelle est très probablement comprise entre 2,94 et 3,46..
Intimé | Évaluation |
UNE | 3 |
B | 3 |
C | 3 |
ré | 3 |
E | 4 |
F | 4 |
g | 3 |
H | 3 |
je | 3 |
J | 3 |
Signifier | 3.2 |
Std. Se tromper | 0,13 |
Résumé
De nombreux chercheurs n'arrivent pas à comprendre la distinction entre l'écart type et l'erreur type, même s'ils sont généralement inclus dans l'analyse des données. Bien que les calculs réels pour l’écart type et l’erreur type semblent très similaires, ils représentent deux mesures très différentes mais complémentaires. SD nous indique la forme de notre distribution, la distance entre les valeurs de données individuelles et la valeur moyenne. SE nous dit à quel point la moyenne de notre échantillon est proche de la moyenne réelle de la population totale. Ensemble, ils aident à fournir une image plus complète que ce que la moyenne seule peut nous dire..