Test Z et test T de Student

January 13, 2018 | Author: Anonymous | Category: Mathématiques, Statistiques et probabilités

Short Description

Download Test Z et test T de Student...

Description

Test Z et test T de Student Comparer une moyenne observée à une moyenne de référence Un échantillon, une variable numérique, une moyenne de référence Situation On souhaite comparer la moyenne d’une variable numérique observée sur un échantillon, à une référence : la moyenne de cette variable sur une population. Exemple Une épreuve chronométrée de dénombrement a été proposée à un groupe d’enfants de 6 ans dyspraxiques. La durée normale pour répondre aux items de l’épreuve est de 3min 30s c'est-à-dire 210s. Dans le groupe étudié, les relevés conduisent à une moyenne de 234s. Le chercheur se demande si l’écart est significatif ou non. Méthode statistique Principe de la méthode La méthode statistique consiste à poser la question suivante : en supposant (hypothèse nulle) que l’échantillon étudié soit un échantillon aléatoire de la population de référence, l’écart entre la moyenne observée et la moyenne théorique est-il important ou non ? Pour répondre à cette question, il faut d’abord mesurer la différence entre la moyenne observée (mobs) et la moyenne de référence (mref). La mesure choisie relativise la différence entre les moyennes, à la fois à l’écart type de référence (σ) et à la taille de l’échantillon (n) : d (mobs ; mref ) =

mobs − mref

σ2

n Avec cette formule, la distance entre la moyenne observée et la moyenne théorique est d’autant plus grande que la taille de l’échantillon est importante et que l’écart-type de la moyenne théorique est faible.

Pour évaluer cette mesure, on calcule la probabilité p d’en obtenir une aussi grande sous l’hypothèse nulle. La loi de probabilité de la mesure dépend de la taille n de l’échantillon. C’est la loi de Laplace-Gauss (normale centrée réduite, notée z) si la taille est au moins égale à 30. Dans le cas contraire, et à la condition que la distribution des valeurs observées soit ellemême approximativement normale, la loi de probabilité est la loi de Student (notée t) à n – 1 degrés de liberté. Ensuite, la méthode se déroule comme celle du test du khi-2. Si la probabilité p est inférieure à un seuil α choisi a priori (5% par exemple), alors l’hypothèse nulle est rejetée et on conclut que la différence des moyennes est significative (au seuil α avec un degré de signification p). Sinon on conclut que la différence des moyennes n’est pas significative au seuil α. Dit autrement dit : grâce à la loi de probabilité, une distance « théorique » est associée au seuil α, c’est la distance au-delà de laquelle la mesure de la différence sera jugée significative. La distance théorique est notée zthéorique ou tthéorique suivant la taille de l’échantillon étudié, de même la mesure observée (fonction discriminante) est notée zobs ou tobs, et alors la différence sera jugée significative si en valeur absolue zobs est supérieure à zthéorique (ou tobs supérieure à tthéorique).

Mise en œuvre de la méthode : test Z ou test T Pour mettre en œuvre la méthode, on doit avoir à sa disposition : la moyenne observée et la taille de l’échantillon ainsi que la moyenne de référence et son écart-type ou, si cet écart-type n’est pas connu, l’écart-type de la moyenne observée sur l’échantillon. Suivant la taille de l’échantillon, pour comparer les deux moyennes, on utilise l’un ou l’autre de deux tests dont la mise en œuvre est analogue : le test Z ou le test T. Mise en œuvre du Test Z Complétons les données : la taille l’échantillon est 36 et l’écart type observé est 60. Avec une moyenne théorique de 210 alors que la moyenne observée est 234, la mesure de la différence entre les moyennes est zobs = 2,4. Cette valeur est-elle grande ? Est-elle trop grande pour laisser supposer que l’échantillon soit issu aléatoirement de la population de référence ? Ou est-elle suffisamment faible pour qu’on ne puisse rejeter cette hypothèse ? Pour répondre (sans machine), il faut penser à la courbe de la loi normale centrée réduite : ] –0,994 ; +0,994[ Fréquence = 68%

]–1,96 ; +1,96[ Fréquence = 95%

]–2,58 ; +2,58[ Fréquence = 99%

0

0

0

1

2

3

À chaque pourcentage correspond une zone de « normalité », zone d’autant plus grande que le pourcentage est grand. Par exemple, si l’on admet une zone de normalité comprenant 95% de la population, les valeurs « normales » sont celles de l’intervalle ]–1,96 ; +1,96[. Autrement dit, la zone « d’anormalité » qui comporte 5% des valeurs est constituée des valeurs inférieures à –1,96 et des valeurs supérieures à +1,96. Dans la pratique des tests, la zone « d’anormalité » est la zone de rejet de l’hypothèse nulle ; elle est déterminée par le seuil de signification choisi a priori. Dans le cas qui nous occupe, la valeur zobs = 2,4 est située à l’extérieur de l’intervalle ]–1,96 ; +1,96[ dont la probabilité est 95%, on peut donc en déduire que la probabilité d’obtenir une différence aussi grande (au sens de la mesure choisie) est inférieure à 5%. La valeur de zobs étant dans la zone de rejet de l’hypothèse nulle au seuil de 5%, on conclut que la durée moyenne de réalisation de l’épreuve de dénombrement par les enfants du groupe étudié est significativement différente au seuil de 5% de la moyenne de référence. Remarque : dans la pratique, le logiciel calcule exactement la probabilité p que la valeur de la fonction discriminante z soit à l’extérieur de l’intervalle ]–2,4 ; +2,4[ : p = 1,64%. Mise en œuvre du Test T Supposons que le nombre d’enfants du groupe étudié ne soit plus 36 mais seulement 25, avec la même moyenne 234 et le même écart type 60. Supposons aussi que la durée de réalisation de l’épreuve de dénombrement suive approximativement une loi normale (dans la pratique, il faudrait le prouver à partir des données recueillies). La fonction discriminante t suit alors la loi T de Student à 24 degrés de liberté. La mise en œuvre du test est ensuite analogue à celle du test Z.

Test unilatéral ou bilatéral ? Revenons aux conditions précédentes de mise en œuvre du test Z où la mesure de la différence était de 2,4 et où p = 1,64%. Au seuil de 1%, on ne pouvait donc pas conclure à une différence significative entre la moyenne observée chez les enfants dyspraxiques âgés de 6 ans et la moyenne de référence. Une valeur qui suit la loi normale a, en effet, une probabilité de 99% de se situer dans l’intervalle ]–2,58 ; +2,58[. Au seuil de 1%, cet intervalle est la zone de normalité, et il lui correspond une zone de rejet composée des deux intervalles ]–∞ ; –2,58[ et ]+2,58 ; +∞[, intervalles pour chacun desquels la probabilité est de 0,5%. Le test Z que nous avons effectué est un test bilatéral. On l’appelle ainsi car nous avons considéré les deux « côtés » autour de la zone de normalité pour déterminer la zone de rejet de l’hypothèse nulle. Il serait pourtant légitime d’affirmer que les enfants dyspraxiques ne peuvent pas réussir significativement mieux que les enfants normaux. Cela conduit à considérer autrement la zone de rejet : comme une valeur qui suit la loi normale a une probabilité de 1% de se situer dans l’intervalle ]+2,32 ; +∞[, c’est cet intervalle qui sera considéré comme zone de rejet au seuil de 1%. On dit qu’on effectue un test unilatéral lorsqu’on définit une zone de rejet non plus situé de part et d’autre de la zone de normalité, mais située d’un seul côté de la zone de normalité. Cela change complètement les conclusions dans le cas qui nous intéresse ici. Avec un test bilatéral au seuil de 1%, on ne peut pas conclure que la moyenne observée chez les enfants dyspraxique est, de manière significative, différente de la moyenne de référence. Mais avec un test unilatéral au seuil de 1%, on peut conclure que la moyenne observée chez les enfants dyspraxique est, de manière significative, supérieure à la moyenne de référence. Avec la feuille de calcul L’utilisateur indique la moyenne de référence et son écart-type, si cette valeur est connue. Il choisit ensuite le seuil, un test bilatéral ou unilatéral, de rentrer les valeurs observées une par une ou directement l’effectif, la moyenne observée et l’écart type sur l’échantillon. En fonction l’effectif de l’échantillon, le test Z ou le test T est mis en œuvre (l’utilisateur doit dans ce dernier cas vérifier par ailleurs que la distribution est approximativement normale…)

Test Z et test T de Student

Short Description

Description

Comments

We need your help!