STATISTIQUES IUT DEUXIEME PARTIE

January 16, 2018 | Author: Anonymous | Category: Mathématiques, Statistiques et probabilités

Short Description

Download STATISTIQUES IUT DEUXIEME PARTIE...

Description

58

IV TESTS D’ADEQUATION 1. Comparaison d’une distribution expérimentale à une loi de probabilité a) But du test On cherche à montrer qu’un ensemble d’observations est distribué suivant une certaine loi statistique. Ce test ne fait pas double emploi avec le test précédent et il n’implique pas le caractère aléatoire des observations. Les observations peuvent très bien être classées par ordre croissant et les effectifs être distribués suivant une certaine loi statistique.

b) Choix de la loi statistique On choisit la loi statistique suivant le caractère continu ou discontinu des mesures et suivant la forme du diagramme en bâtons ou de l’histogramme expérimental. On calcule également la variance et la moyenne expérimentales. Si m est voisin de s² et si le caractère est discret, la distribution peut être bien représentée par une loi de Poisson. Pour une loi Normale ou Log Normale, on construit un histogramme et on se base sur l’allure de cet histogramme. On calcule évidemment aussi la moyenne et la variance expérimentales. c) Ajustement de la loi statistique à la distribution expérimentale (variable discrète) Pour les variables discrètes on compare pour chaque valeur de la variable les grandeurs : ni (effectifs expérimentaux) à n.P(xi) (effectifs théoriques, n est le nombre total de mesures) En effet la fréquence fi =

ni → P(xi) d’après le théorème de Bernouilli, mais le test du χ² exige qu’on n

convertisse les fréquences en effectifs. On peut regrouper plusieurs valeurs consécutives de xi en classes, dans ce cas on opère sur l’effectif total des classes appelé nj c’est-à-dire :

n j=

∑ ni

classe

Pierre Jost

cette valeur est comparée à n ×

∑ P(x i )

classe

Statistiques à l’usage des ingénieurs et des techniciens

59

Fig. 27 Ajustement d’une loi et d’une distribution discontinues d) Ajustement de la loi statistique à la distribution expérimentale (variable continue)

Pour des variables continues le problème est plus complexe parce qu’il faut comparer l’effectif d’une classe à une probabilité. Comme la loi statistique est une fonction de densité de probabilité il faut intégrer celle-ci aux bornes des classes de l’histogramme.

Fig. 28 Ajustement d’une loi continue et d’un histogramme Il faut donc comparer pour chaque classe l’effectif ni de la classe à l’intégrale

n × P ( x < X < x+ ∆x ) = n ×

x+∆x

∫

g(X)dX = n × (G ( x+∆x ) − G(x))

x

évidemment n =

∑ n i et x, x + ∆x sont les bornes des classes, g(X) est la loi de probabilité testée

et G(X) sa fonction de répartition.

Pierre Jost

Statistiques à l’usage des ingénieurs et des techniciens

60

Les effectifs théoriques sont calculés à l’aide d’une des trois relations:

ni est comparé à

    ou   ou 

n( G( x + ∆x) − G(x)) n ( g( x + ∆x) + g(x)) ∆x 2 1   n g x + ∆x ∆x  2 

e) Test proprement dit Lorsqu’on a choisi une loi statistique, effectué le regroupement des valeurs expérimentales en classes et calculé correctement les effectifs théoriques on passe au calcul du χ². Soit k le nombre de classes (ou de valeurs individuelles).

k

( n i − np i ) 2

i =1

np i

χ =∑ 2

k n 2 =∑ i −n np i i =1

(36)

npi représente les effectifs théoriques donc, soit np(xi) soit une des relations ci-dessus. La grandeur χ² suit une loi du Khi-deux à ν degrés de liberté avec

ν = k −1− r k : le nombre de classes 1 pour le calcul de n r : nombre de paramètres pour le calcul des effectifs théoriques. r = 1 (loi de Poisson) r = 2 (loi binomiale et loi Normale)

f)

Conditions d’application et interprétation du test

Pour chaque classe il faut que : npi ≥ 5 et ni ≥ 4 parce que le terme npi apparaît au dénominateur et une valeur trop faible fausse le calcul du χ². Si cette condition n’est pas réalisée il faut augmenter la largeur des classes. Pour un bon ajustement le nombre de classes doit être > 5. Une valeur faible du χ 2 c indique que la loi choisie convient (χ² = 0 si tous les ni = npi). On cherche dans la table du χ² la valeur critique χ²c correspondant à P = 1 - α, si α est le seuil de risque du test.

Pierre Jost

Statistiques à l’usage des ingénieurs et des techniciens

61 Si χ² < χ²c la loi est non significativement différente de la loi testée. Cela ne signifie pas que la loi testée est la seule qui conviendrait. D’autres lois, bien que conduisant à un χ² plus élevé peuvent être non rejetées.

2. Test de Normalité de Shapiro-Wilk a) Intérêt des tests de normalité La plupart des tests (Fisher, Student, …) ne s'appliquent que lorsque les populations se distribuent suivant une loi Normale. Il est donc important de pouvoir prouver cette propriété en faisant le moins possible d'essais. Le test de Khi-deux est utilisable, mais il nécessite un très grand nombre de mesures (plusieurs dizaines ou centaines).

b) Test proprement dit Ce test est beaucoup utilisé parce qu'il est assez puissant et nécessite peu de mesures (une dizaine). Son principe est basé sur les probabilités associées aux écarts interfractiles. (On teste si les différences xi – xj sont compatibles avec les probabilités des écarts interfractiles) Les mesures sont classées par ordre croissant : x1 ≤ x2 ≤ … ≤ xj ≤ … ≤ xn On calcule : d1 = xn – x1 , d2 = xn-1 – x2 , …

dj = xn - j+1 – xj avec j = 1, 2 …

n −1 n ou suivant que n est pair ou impair 2 2

ensuite la somme

[∑ a d ]

2

W=

∑ (xi

j

j

− m)

2

(37)

Les poids aj sont calculés en fonction des fractiles de la loi de Gauss (plus la probabilité est faible, plus on donne un poids élevé à l'intervalle interfractile) et sont tabulés en fonction de n et de j. L’hypothèse de Normalité est acceptée lorsque W est compris dans l’intervalle des valeurs critiques [W(α/2),W(1-α/2)]. Si W.> W(1-α/2), La distribution est trop aplatie (existence de nombreuses valeurs éloignées de la moyenne ce qui entraîne une valeur élevée de W), par contre si W.< W(α/2) il y a trop de valeurs proches de la moyenne (le numérateur de W est alors trop faible).

Pierre Jost

Statistiques à l’usage des ingénieurs et des techniciens

62

TESTS D’HYPOTHESES CE QU’IL FAUT ABSOLUMENT RETENIR

Pratique des tests statistiques. Signification des risques de première et de deuxième espèce. Lien entre les risques et leur variation en fonction du nombre de mesures. Connaître tous les tests d’égalité des moyennes et des variances. Savoir retrouver facilement les tests d’ajustement. Savoir lire les tables statistiques

Pierre Jost

Statistiques à l’usage des ingénieurs et des techniciens

STATISTIQUES IUT DEUXIEME PARTIE

Short Description

Description

Comments

We need your help!