MTH 2301 Méthodes statistiques en ingénierie Lexique anglais
Short Description
Download MTH 2301 Méthodes statistiques en ingénierie Lexique anglais...
Description
MTH 2301 Méthodes statistiques en ingénierie
MTH 2301 Méthodes statistiques en ingénierie-
Chapitre 6 - Distributions échantillonnales et estimation
Lexique anglais - français
Lexique
anglais – français
• sample statistic ………. statistique échantillonnale
Constats et terminologie statistique Distribution de la moyenne – théorème central- limite Estimation : Intervalle de confiance pour la moyenne µ Calcul de la taille échantillonnale n Estimation : différence entre 2 moyennes µ 1 - µ 2 Estimation : variance σ2 - écart type σ
• sampling distribution ….. loi (distribution) d’échantillonnage • sample mean …………….. moyenne échantillonnale • estimator …………………. estimateur • estimate …………………… estimation • interval estimate ……….. estimation par intervalle • point estimate …….…….. estimation ponctuelle
Loi d’échantillonnage : quotient de 2 variances σ12/σ22 Loi d’échantillonnage : étendue R et écart type S Intervalle de tolérance pour une variable
• confidence level ………… niveau de confiance • one-sided …………………... unilatéral
Hors programme : Estimation : paramètre θ d’une loi binomiale (6.5 et 6.6) Estimation : différence θ1 - θ2 entre 2 lois binomiales
• two-sided …………………… bilatéral • paired samples ……………. échantillons appariés
6 -1
Bernard CLÉMENT, P h D
6- 2 Bernard CLÉMENT, P h D
MTH 2301 Méthodes statistiques en ingénierie
MTH 2301 Méthodes statistiques en ingénierie
Constats et terminologie statistique
Constats et terminologie statistique
• les populations statistiques sont modélisées par des lois de probabilités dont les paramètres sont toujours inconnus; • le mieux que l’on puisse faire: estimer les paramètres avec des données échantillonnales (observations ) provenant de la population; • les données ( X1, X2, …) sont transformées en statistique Y par une fonction Y = h ( X1, X2 ,…. ) et Y est une variable aléatoire le choix de h dépend de l’application envisagée ( estimation ou test) la loi de probabilité de Y s’appelle distribution d’échantillonnage; exemple : 2 échantillons de taille n provenant de la même population ( X1, X2, …Xn) et ( X1’, X2’ , ….., Xn’ ) auront une moyenne ( xbar), différente, un écart type s différent, un histogramme différent : c’est l’influence de la variabilité de l’échantillonnage; • on dispose toujours que d’un seul échantillon de taille n pour mettre en œuvre une procédure statistique : estimation ou test • paramètre statistique ξ : toute quantité associée à une loi de probabilité ex. ξ = µ : moyenne loi gaussienne , ξ = σ : écart type loi quelconque ξ = θ (1 - θ ) : moyenne loi Bernoulli ( θ)
Échantillon aléatoire : un ensemble de variables aléatoires X 1 , X 2 , , X n telles que (a) les variables sont soumises à une même loi f(x) (b) les variables sont indépendantes donc la loi conjointe : g (X1, X2, …, Xn) = f( X1)* f(X2) * …* f(Xn) Statistique : toute fonction aléatoire établie sur l’échantillon remarque : Y est une v.a Y = h (X1 , X2 , …., X n ) Estimateur : une statistique particulière conçue de façon à fournir une estimation d’un paramètre d’une loi de probabilité Estimation ponctuelle d’un paramètre ξ : est la valeur numérique ξ prise par un estimateur sur la base d’un échantillon (x1, x2,…, xn) ξ = h( x1, x2, … , xn ) Estimation par intervalle : d’un paramètre statistique ξ est un intervalle (a,b) dont les valeurs a et b dépendent de l’échantillon (x1, x2,…, xn) et une probabilité spécifiée 1 - α (appelée coefficient de confiance ) de telle sorte que : P ( a ≤ ξ ≤ b) = 1- α
6- 3
Bernard CLÉMENT, P h D
6- 4 Bernard CLÉMENT, P h D
MTH 2301 Méthodes statistiques en ingénierie
MTH 2301 Méthodes statistiques en ingénierie
Loi d’échantillonnage ( ce concept est fondamental ) tout estimateur ξ possède une loi de probabilité appelée loi (ou distribution) d’échantillonnage ; l’étude des propriétés de l’estimateur repose sur l’étude des propriétés de cette distribution. distribution d’échantillonnage
Soit X 1 , X 2,, ….. , X E( Xi ) = µ i et
Résultat 1
soient
a 1, a 2,, …. , a n des
i=n
E( ξ )
W =∑ a iX
soit
n1 ξ
Alors
n2 > n1
constantes et
une combinaison linéaire des X i
i
i=1
n2
des v. a. indépendantes telles que Var ( Xi ) = σi2 i = 1, 2, …, n
n
E( W ) = µ W = ∑ a i µ i et Var ( W ) = σw2 = ∑ ai2 σi2
remarque 1 : aucune hypothèse est nécessaire sur les lois des X i remarque 2 : si les X sont gaussiennes alors W est gaussienne
ξ
Résultat ( sous certaines conditions très générales ) : la distribution d ’échantillonnage est approximativement en forme de cloche (gaussienne) et sa dispersion (variance) diminue lorsque n augmente
Résultat 2
Soit ai = 1 / n
Var( X i ) = σ2
E(X ) = µ
i=n
W = X = Xbar = ∑ (1 / n ) X i
Estimateur sans biais ( sans erreur systématique ) : un estimateur dont la moyenne est égale au paramètre à estimer : E( ξ ) = ξ
vérifie
alors
et Var( X ) = σ2 / n
E( X ) = µ
i=1
Propriété la plus importante d’un estimateur = Var( ξ )
Résultat 3
« bon » estimateur : a une petite variance
alors X
« meilleur » estimateur : est sans biais et à variance minimum 6 -
X i ~ N ( µ , σ2 )
Si les X i sont gaussiennes
N ( µ , σ2 / n )
est gaussienne
6- 6
5
Bernard CLÉMENT, P h D
Bernard CLÉMENT, P h D
MTH 2301 Méthodes statistiques en ingénierie
uniforme
Loi de X
POPULATION
exponentielle
gaussienne H is t o g r a m ( c h a p 0 6 . s t a 3 1 v * 3 0 0 0 0 c )
H is t o g r a m ( c h a p 0 6 . s t a 3 1 v * 3 0 0 0 0 c )
H is t o g r a m ( c h a p 0 6 . s t a 3 1 v * 3 0 0 0 0 c ) 8000
700
g a u s s ie n n e = 3 0 0 0 0 * 0 .1 7 1 5 * n o r m a l ( x ; - 0 . 0 0 1 8 ; 1 . 0 0 7 8 ) 2400
7000
600
2200 2000 1800
500
1600
400
300
No of obs
n=1
No of obs
5000
No of obs
Distribution de la moyenne échantillonnale et théorème central limite
6000
4000 3000
1400 1200 1000 800 600
2000
200
400
100
théorème central – limite
0 - 1 .7 3 1 8
- 1 .1 7 7 6 - 1 .4 5 4 7
- 0 .6 2 3 4 - 0 .9 0 0 5
- 0 .0 6 9 1
0 .4 8 5 1
- 0 .3 4 6 2
0 .2 0 8 0
1 .0 3 9 3 0 .7 6 2 2
u n if o r m e
7 . 21 8 4 6 .1 9 1 1
9 .2 7 3 0 8 .2 4 5 7
0 - 3 .9 0 9 5
1 1 .3 2 7 6 1 0 .3 0 0 3
- 1 .1 6 5 4 - 1 .8 5 1 4
0.206 6
1 . 57 8 7
- 0 .4 7 9 4
0.892 6
2 .9 5 0 7 2 .2 6 4 7
4 .3 2 2 7 3 .6 3 6 7
g a u s s ie n n e
His to g r a m ( c h a p 0 6 .s t a 3 1 v *3 0 0 0 0 c ) no r m2 = 1 50 0 0*0 .10 3 2*n o r ma l( x ; - 0. 0 01 8 ; 0 .71 3 9) 10 00
1800
90 0 1600
80 0
600 1400
70 0
500
1200
400
60 0 No of obs
No of obs
No of obs
n=2
1000 800
300
200
2)
10 0
0 - 0 .9 9 6 1 - 1 .1 7 7 3 - 1 .4 5 3 0
- 0 .6 2 6 0 - 0 .9 0 1 7
- 0 .0 7 4 7
0 .4 7 6 5
- 0 .3 5 0 4
0 .2 0 0 9
1 .0 2 7 8 0 .7 5 2 2
1 .5 7 9 1
0 .2 4 9 1 - 0 .3 7 3 5
1 .3 0 3 5
1 .4 9 4 4 0 .8 7 1 7
2 .7 3 9 6
3 . 98 4 8
2 .1 1 7 0
3 .3 6 2 2
5 .2 3 0 1 4 .6 0 7 4
0 - 2 .6 4 9 6
6 .4 7 5 3 5 .8 5 2 7
no rm2
H is to g r a m ( c h a p 0 6 .s ta 3 1 v *3 0 0 0 0 c ) e x p o 5 = 6 0 0 0 *0 .0 7 7 4 *n o r ma l( x ; 0 .0 0 3 1 ; 0 .4 4 5 5 )
H is to g r a m ( c h a p 0 6 .s ta 2 1 v * 3 0 0 0 0 c )
His to g r a m ( c h a p 0 6 .s t a 3 1 v *3 0 0 0 0 c )
600
un if 5 = 6 0 00 * 0 .05 72 *n or m al ( x ; 7 .93 2 7E - 5 ; 0 .45 0 6)
n o r m5 = 6 00 0* 0.0 67 2 *no rma l( x ; - 0.0 0 18 ; 0 . 4 48 9) 40 0
350
500
300
200
30 0 25 0 No of obs
No of obs
No of obs
35 0
400
250
300
150
20 0 15 0
200
i
- 1 .8 2 3 7 - 0 .9 9 7 8 - 0 .1 7 1 9 0 . 65 4 1 1 .4 8 0 0 2 .3 0 5 9 - 2 .2 3 6 7 - 1 .4 1 0 7 - 0 .5 8 4 8 0.241 1 1 .0 6 7 0 1 .8 9 2 9
expo2
u n if 2
n=5
40 0
20 0
200
0 - 1 .7 2 8 6
50 0
30 0
400
100
100
10 0
100 50
50
0 - 1 .4 4 5 5
Var ( X i ) = σ2
- 0 .9 8 7 6 - 1 .2 1 6 5
Résultat 5 Si E( X i ) = µ , i = 1, 2 ,… , n alors X suit approximativement loi gaussienne N ( µ , σ2 / n )
- 0 .5 2 9 7 - 0 .7 5 8 7
- 0 .0 7 1 9
0 .3 8 6 0
- 0 .3 0 0 8
0 .1 5 7 0
0 .8 4 3 8 0 .6 1 4 9
0 - 0 .9 3 5 5
1 .3 0 1 7
- 0 .3 1 6 2 - 0 .6 2 5 9
1 .0 7 2 7
0 .3 0 3 0
0 .9 2 2 2
- 0 .0 0 6 6
0 .6 1 2 6
1 .5 4 1 4 1 .2 3 1 8
2 .1 6 0 6 1 .8 5 1 0
0 - 1 .6 7 8 2
2 .7 7 9 9 2 .4 7 0 3
- 1 .1 4 0 9 - 1 .4 0 9 6
- 0 .6 0 3 7 - 0 .8 7 2 3
- 0 .0 6 6 4 - 0 .3 3 5 0
ex po5
u n if 5 H is to g r a m ( c h a p 0 6 .s ta 2 1 v * 3 0 0 0 0 c ) u n if 1 5 = 2 0 0 0 * 0 .0 3 1 6 * n o r m a l( x ; 7 .9 3 2 7 E- 5 ; 0 .2 5 8 6 )
1.008 1 0.739 5
1.545 4 1.276 7
no rm1 5 = 20 00*0 .03 61*n ormal(x ; -0. 001 8; 0 .25 86)
160
140
140
100
0.470 9
His togram (chap06.sta 31v *30000 c)
e x p o 1 5 = 2 0 00 *0 .0 3 69 *n orm al( x ; 0 . 00 3 1 ; 0 .2 5 6 7 )
120
0.202 2 no r m5
His to g r a m ( c h a p 0 6 .s ta 3 1 v *3 0 0 0 0 c )
120
120
100 100 No of obs
n = 15
No of obs
80
60
40
80 60 40
20
on peut écrire le résultat sous la forme équivalente _ X - µ_ suit approximativement une loi N ( 0, 1)
No of obs
Remarque : il n’y a aucune condition spécifique sur les lois des X
- 2 .5 3 7 5 - 3 .2 2 3 5
H is t o g r a m ( c h a p 0 6 . s t a 3 1 v * 3 0 0 0 0 c )
600
Alors Y suit approximativement une loi gaussienne N ( µY , σY avec µ Y = ∑ µ i et σY2 = ∑ σi2
80
60
40
20
20
0 - 0 .7 5 6 0
- 0 .5 0 3 5 - 0 .6 2 9 8
- 0 .2 5 1 0 - 0 .3 7 7 2
0 .0 0 1 6
0 .2 5 4 1
- 0 .1 2 4 7
0 .1 2 7 8
0 .5 0 6 6 0 .3 8 0 4
0 .7 5 9 2
0 - 0 .6 4 9 9
0 .6 3 2 9
-0 .3 5 4 8 -0 .5 0 2 3
u n if 1 5
-0 .0 5 9 8 - 0 .2 0 7 3
0 .2 3 5 3 0 .0 8 7 8
His to g r a m ( c h a p 0 6 .s ta 2 1 v *3 0 0 0 0 c )
0 .5 3 0 3 0 .3 8 2 8
0 .8 2 5 4 0 .6 7 7 8
1 .1 2 0 4
0 -1.0046
0 .9 7 2 9
ex po 15
u n if 3 0 = 1 0 0 0 *0 .0 2 4 9 *n o r ma l( x ; 7 .9 3 2 7 E- 5 ; 0 .1 8 2 5 )
-0.7161 -0.8604
H is to g r a m ( c h a p 0 6 .s ta 3 1 v *3 0 0 0 0 c )
70
-0.4275 -0.5718
-0.1389 -0.2832
0.1497 0.0054
0.4382 0.2940
0.7268 0.5825
His to g r a m ( c h a p 0 6 norm15 .s t a 3 1 v *3 0 0 0 0 c )
e x p o 3 0 = 1 0 00 *0 .0 2 42 *n or m al( x ; 0 . 00 3 1 ; 0 .1 8 1 6 )
no r m3 0 = 10 0 0*0 .02 3 8*n o r ma l( x ; - 0. 0 01 8 ; 0 .18 5 4)
60
60
60
σ/√n
50
50
40
40
40 No of obs
No of obs
50
n = 30
30
20
6- 7
30
10
10
0 - 0 .6 3 7 8
- 0 .4 3 8 2 - 0 .5 3 8 0
- 0 .2 3 8 7 - 0 .3 3 8 4
- 0 .0 3 9 1 - 0 .1 3 8 9
0 .1 6 0 5 0 .0 6 0 7
u n if 3 0
Bernard CLÉMENT, P h D
0 .3 6 0 1 0 .2 6 0 3
0 .5 5 9 7 0 .4 5 9 9
30
20
20
10
Bernard CLÉMENT, P h D
5 .1 6 3 8 4 .1 3 6 5
2000
700
i = 1, 2, … , n
3 .1 0 9 2 2 .0 8 1 9
e x p o n e n t ie lle
H is t o g r a m ( c h a p 0 6 . s t a 2 1 v * 3 0 0 0 0 c )
remarque
1 .0 5 4 6 0 .0 2 7 3
1 .5 9 3 5 1 .3 1 6 4
u n if 2 = 1 5 0 0 0 * 0 . 0 6 8 9 * n o rm a l( x ; 7 .9 3 2 7 E- 5 ; 0 .7 0 6 )
Soit Y = ∑ X i avec E( X i ) = µ i , Var ( X i ) = σi2 Si « n est assez grand » ( au moins 30 )
200
0 - 1 .0 0 0 0
No of obs
Résultat 4 :
1000
0 - 0 .5 1 4 5
- 0 .3 2 0 8 - 0 .4 1 7 6
- 0 .1 2 7 0 - 0 .2 2 3 9
0 .0 6 6 7 - 0 .0 3 0 2
0 .2 6 0 4 0 .1 6 3 6
0 .4 5 4 2 0 .3 5 7 3
0 .6 4 7 9 0 .5 5 1 0
0 - 0 .6 6 5 2
- 0 .4 7 5 0 - 0 .5 7 0 1
ex po30
MTH 2301 Méthodes statistiques en ingénierie (6-8)
- 0 .2 8 4 8 - 0 .3 7 9 9
- 0 .0 9 4 6 - 0 .1 8 9 7
0.095 6 0.000 5
no rm3 0
0.285 8 0.190 7
8
0.476 0 0.380 9
MTH 2301 Méthodes statistiques en ingénierie Exemple 1 :
MTH 2301 Méthodes statistiques en ingénierie
approximation de la loi binomiale par une loi gaussienne ( voir chap. 5)
Exemple 3 : La demande quotidienne d’énergie électrique ( KWh ) pour un logement est
est un cas particulier de l’application du théorème central – limite.
une variable de moyenne 200 et d’écart type 20. Soit D la demande totale d’énergie
X = nombre de succès dans une suite de n essais de Bernoulli indépendants X i v. a. de Bernoulli associée au i -ème essai i = 1, 2,…, n 1 avec probabilité θ Xi = 0 avec probabilité 1 - θ E(Xi) = 0*(1-θ) + 1*θ =θ X = ∑ X i est une v. a binomiale b( n, θ ) On applique le résultat 4 : Donc
X – n θ__
X suit
√ n θ ( 1- θ )
solution :
P ( D ≤ D 0 ) = 0.99
- θ____
Donc
et
et σ2 = 500 * 202 = 200 000 = ( 447.2 )2 Φ ( (D 0 - 100 000 ) / 447.2 ) ) = 0.99
Exemple 4 : la durée de vie X d’un composant électronique suit une loi exponentielle
√ θ ( 1- θ ) / n
X suit loi b( n, θ = 0.1)
une loi gaussienne N ( µ , σ 2 )
D 0 = 100 000 + z 0.99 * 447.2 = 100 00 + 2.33 * 447.2 = 101 042
suit approximativement loi N ( 0, 1)
de moyenne 100 heures
P ( 0.05 ≤ X / n ≤ 0.15 ) = 0.95 ( * ) ( * ) s’écrit
ou X i est la demande du logement i = 1, 2, …., 500 approximativement
µ = 500 * 200 = 100 000
Var ( X i ) = θ ( 1 – θ )
Exemple 2 : dans un contrôle de la qualité en cours de réception, on doit prélever un échantillon de taille n dans un lot contenant 10% de non- conformes. Déterminer n pour que le nombre X d’articles non- conformes dans l’échantillon vérifie l’équation: solution
D=∑Xi D suit
approximativement loi N ( n θ , n θ ( 1 - θ ) )
X
=
électrique dans un arrondissement de 500 logements. Calculer une limite supérieure D 0 pour D qui ne serait pas dépassée avec probabilité 0.99
X suit approximativement loi N ( 0.1*n, 0.09*n )
Φ ( ( 0.15n – 0.1*n + 0.5 ) / 0.3 √ n ) ) - Φ ( ( 0.05n – n*0.1 - 0.5 ) / 0.3 √ n ) ) = 0.95
(a) Quelle est la probabilité que la durée moyenne X de 36
composants dépasse 125 heures (b) Combien de composants doit- on avoir fin que la différence entre X et 100 n’excède pas 10 avec une probabilité de 0.95 ? solution : si X suit une loi exponentielle l’écart type ( X ) = moyenne ( X ) = 100 ( chap. 5) alors X suit approximativement une loi N ( 100, 100 2 / 36 ) ( a ) P ( X > 125 ) = 1 – Φ ( ( 125 – 100) / (100 / 6 ) = 1 - Φ ( 1.5 ) = 1 - 0.933 = 0. 067 ( b ) P ( │ X - 100 │ < 10 ) = 0.95
alors
100 / √ n
Φ ( ( 0.05n + 0.5 ) / 0.3 √ n ) ) = 0.975 alors ( 0.05n + 0.5 ) / 0.3 √ n ) ) = 1.96 n 2 -118.3n + 100 = 0
et
P ( │ X - 100 │ <
2 Φ ( √ n / 10 ) - 1 = 0.95
n = 118
donne
10 __ ) = 0.95 100 / √ n
n = 384
6- 9 Bernard CLÉMENT, P h D
MTH 2301 Méthodes statistiques en ingénierie
MTH 2301 Méthodes statistiques en ingénierie
Estimation de la moyenne µ d’une population : méthode de l’intervalle de confiance Cas A : population gaussienne et variance σ soit X 1 , X 2, …, X n
un échantillon
de X
2
connue
alors
X
~
N(µ, σ
( X–µ ) /(σ /√n)
P( -z1–α/2 ≤ ( X–µ ) /(σ /√n) ≤ z 1–α/2 ) = 1 - α
alors
2)
~ N ( 0, 1 ) (*)
0.14
N ( 0, 1) :
0.12
0.10
GAUSS
1-α
0.06
gaussienne
α/ 2
0.08
centrée – réduite 1 - α : coefficient
0.04
de confiance
0.02
0.00
-0.02 -2
0
2
4
6
8
10
-z1–α/2 On isole le paramètre µ
12
14
16
0
de l’équation (
√n
≤
18
20
22
24
26
Z = ( X – µ ) / (σ / √ n )
z 1–α/2
U
X - z 1–α/2 σ
Bernard CLÉMENT, P h D
6 - 10 Bernard CLÉMENT, P h D
*) µ
Exemple 5 : supposons que la durée ( heures) de vie X d’ampoules électriques d’une certaine marque est une loi gaussienne de moyenne µ ( inconnue) et écart type de 100 h (a) Déterminer un intervalle de confiance avec coefficient de confiance de 0.95 pour µ si un échantillon de n = 20 ampoules a donné les durées de vie : 1076.2 - 989.2 - 1013.9 1152.5 - 1076.8 - …… 1028.7 - 946.2 - 1111.8 - 1060.5 de moyenne X = 1028.5 h (b) Refaire ( a ) avec une coefficient de confiance de 0.99 (c) Combien d’ampoules doit –on échantillonnées si on veut un intervalle de confiance à 0.95 de longueur égale à 30 ? 1028.5 - ( 1.96 * 100 / √ 20 ) ≤ µ ≤ 1028.5 + ( 1.96 * 100 ) / √ 20 ) Solution : (a) 1028.5 – 43.8 ≤ µ ≤ 1028.5 + 43.8 984.7 ≤ µ ≤ 1072.3 ( b ) avec un coefficient de confiance de 0.99 le percentile 1.96 change pour 2.576 et l’intervalle de confiance devient 970.9 ≤ µ ≤ 1086.1 (c) la longueur de l’intervalle en (a) est de 2*43.8 = 87.6 avec n = 20 on veut 2 * 1.96 * 100 / √ n = 30 donc n = 171 Détermination de la taille de l’échantillon : calcul de n
pour obtenir l’intervalle de confiance de µ
coefficient de confiance = 1 - α
( avec σ connu )
longueur de l’intervalle = 2∆
on connaît σ
≤ X + z 1–α/2 σ
√n
on spécifie :
n 6 - 11
=
(z 1–α/2 σ / ∆ ) 2 6 - 12
Bernard CLÉMENT, P h D
MTH 2301 Méthodes statistiques en ingénierie
MTH 2301 Méthodes statistiques en ingénierie
Exemple 6 : suite de l’ex. 5 - Un deuxième échantillon de 20 ampoules a donné une vie moyenne de 981 h. L’intervalle de confiance à 0.95 est : 937.2 ≤ µ ≤ 1024.8
intervalles de confiance : échantillons 1-50 de 5 obs. 1250
Remarque : dans toute étude statistique on a toujours qu’un seul échantillon de taille n qui est prélevé. Toute décision à prendre repose sur cet échantillon uniquement. Dans l’exemple 6, on a prélevé un deuxième échantillon pour des fins d’illustration mais si c’était le cas réel, on aurait combiné les deux en un seul échantillon de taille 40.
1200 1150
Interprétation d’un intervalle de confiance
1100
Le coefficient de confiance se rapporte à la procédure à long terme : ( 1 - α ) 100% des intervalles calculés avec la formule génèrent des intervalles qui contiendront µ. On ne sait jamais si l’intervalle calculé avec l’échantillon observé contient µ mais notre degré de confiance est de ( 1 - α ) 100% qu’il fait partie de ceux qui contienne µ ( les ‘ bons ‘ )
1050
µ =1000
1000
L’interprétation peut être comprise et illustrée seulement avec des données simulées provenant d’une population gaussienne dont la moyenne est connue : exemple 7
950 900
Exemple 7 : simulation de 100 échantillons de taille n = 5 provenant d’une population gaussienne
µ = 1000
et
850
σ = 100
7 échantillons : # 14 – 23 – 25 – 49 – 71 – 73 – 79 ne contiennent pas 1000
800
#14 – 23 - 25 – 49 : intervalles excluant 1000
graphiques : page suivantes
moy-de-5
750
6 - 13 Bernard CLÉMENT, P h D
6 - 14 Bernard CLÉMENT, P h D
MTH 2301 Méthodes statistiques en ingénierie
MTH 2301 Méthodes statistiques en ingénierie Définition
d’ une
loi de Student
échantillons 51 à 100 : groupe de 5 obs 1250
Une
variable aléatoire T
dont la densité
de probabilité
est définie par
f T ( t ) = c (ν ) ( 1 + t / 30 la loi de Student 800 750
est quasi identique à une loi gaussienne centrée réduite
71 – 73 - 79 moy-de-5
6 - 15 Bernard CLÉMENT, P h D
6 - 16 Bernard CLÉMENT, P h D
MTH 2301 Méthodes statistiques en ingénierie
MTH 2301 Méthodes statistiques en ingénierie table
des
quantiles d’une loi de Student
Résultat 6
l o i de S t u d e n t
Soit
Annexe H OTHM
Alors T =
tp,ν
X =
X - µ_ s/√n
p. 535
( W. Gossett) Var ( X i ) = σ2
E ( Xi ) = µ ,
Soit
∑Xi/n
i = 1, 2 ,… , n
S2 = ∑ ( X i – X ) 2 / ( n - 1 )
et
suit une loi de Student avec ν = n – 1 degrés de liberté
Remarque : la lettre T est généralement consacrée pour représenter la variable de cette loi
:
Cas B : population gaussienne et variance σ 2
quantile d’ordre p
X ~ N(µ, σ2=?)
inconnue
intervalle de confiance de la moyenne
loi Student Tν
X - t 1 – α / 2, n - 1 s ≤ µ ≤ X + t 1 – α / 2, n - 1 s √n √n
ν degrés de liberté P ( Tν ≤ t p , ν ) = p
Exemple 8 :
6 observations de la durée de vie d’ampoules a donné 863.0 - 1016.2
Exemple :
- 945.8 - 992.5 - 943.8
X = 961.3
P ( T5 ≤ 2.015 ) = 0.95
et
- 1006.4
s = 57.0
Int. confiance à 0.90 pour µ : 961.3 ± 2.015 * 57 / √ 6 = ( 914.4 , 1008.2 ) 6 - 17
6 - 18
Bernard CLÉMENT, P h D
Bernard CLÉMENT, P h D
MTH 2301 Méthodes statistiques en ingénierie
MTH 2301 Méthodes statistiques en ingénierie
Estimation de la moyenne µ d’une population : méthode de l’intervalle de confiance C :
population quelconque et
n
Loi d’échantillonnage de la différence entre 2 moyennes avec variances connues
au moins 30
0.14
0.14
X ~ N ( µX, σX2)
0.12
intervalle de confiance approximatif pour la moyenne
0.10
X - z1 – α / 2 s ≤ µ ≤ X + z1 – α / 2 s √n √n
0.10
σX
GAUSS
0.08
0.08
0.06
0.02
0.02
0.00
0.00
Exemple 9 : la durée de vie de 50 ampoules électriques d’une certaine marque a donné Intervalle
X = 1014
et
s = 98.7
de confiance à 0.90 pour µ
-0.02
-0.02 -2
0
2
4
6
8
10
12
µX
14
16
18
X = ∑ X i / n1
1014 ± 1.96 * 98.7 / √ 50 1014 ± 27.4
20
22
24
26
-2
0
2
4
échantillons indépendants moyennes
Résultat 7 : ( a ) E ( X - Y ) = µX - µY
( 986.6 , 1041.4 )
6
8
10
( b ) Var ( X - Y ) = σX2 / n1 + σY 2 / n2
12
µY
14
16
18
20
22
24
U
U
X1, X2, … , Xn1
est
σY
0.06
0.04
0.04
Remarque : la formule repose sur le théorème central - limite
Y ~ N ( µY, σY2)
0.12
GAUSS
Cas
Y1, Y2, … , Yn2 Y = ∑ Y i / n2 vrai sans aucune hypothèse sur les lois
( c ) X - Y ~ N ( µX - µY , σX2 / n1 + σY2 / n2 ) ( d ) le résultat ( c ) est approximatif si n1 et n2 sont plus grands que 30 6 - 19 Bernard CLÉMENT, P h D
6 - 20 Bernard CLÉMENT, P h D
26
MTH 2301 Méthodes statistiques en ingénierie Cas D : intervalle de confiance - différence de 2 moyennes
MTH 2301 Méthodes statistiques en ingénierie µX - µY
Loi d’échantillonnage de la différence entre 2 moyennes avec variances inconnues égales
variances connues
0.14
X ~ N ( µX,
0.10
0.12
σ2)
pour la différence de vie ( heures ) moyenne de deux types ( X et Y) d’ampoules électriques à l’aide des X : solution
n = 16
informations suivantes :
σ = 128
0.08
σ
0.06
X = 1050
0.04
0.02
0.02
0.00
µX
-0.02 -2
0
2
4
6
8
10
12
-0.02 14
16
18
20
22
26
-2
0
2
4
6
8
µY
10
12
14
16
18
20
SY2 = ∑ ( Y i – Y ) 2 / ( n2 - 1 )
variances
[ ( n1 -1 ) SX2 + ( n2 – 1) SY2 ] / ( n1 + n2 -2)
« pooled »
les ampoules de type X durent elles ( en moyenne ) plus longtemps Résultat 8 :
( X - Y ) - ( µX - µY ) Sp √ 1/ n1 + 1 / n2
= T ~ Student avec n1 + n2 -2 ddl
6 - 21 Bernard CLÉMENT, P h D
6 - 22 Bernard CLÉMENT, P h D
MTH 2301 Méthodes statistiques en ingénierie intervalle de confiance - différence de 2 moyennes variances inconnues mais égales
MTH 2301 Méthodes statistiques en ingénierie Résultat 9 :
µ X - µY
Exemple 11 :
et la méthode nouvelle. On croit que la nouvelle méthode
Cas F :
Sp2
2
2
n1 = 10
X = 55
sX = 10
n2 = 12
Y = 40
sY = 7
= ( 9 x 10 + 11 x 7 ) / 20 = 8.48
ν = min ( n1-1, n2 -1)
µX - µY : X - Y ± t 1 – α/2, ν [ sx2 / n1 + sY2 / n2 ] 0.5
à 95 % pour la différence de temps moyen d’assemblage entre les 2 méthodes. méthode nouvelle :
= T ~ Student avec ν ddl
intervalle de confiance - différence de 2 moyennes µX - µY variances inconnues et inégales ν = min ( n1-1, n2 -1)
n’affecte pas sensiblement la variabilité. Déterminer un intervalle de confiance
Y
sont inconnues et inégales alors
(méthode Hsu)
on a modifié la séquence d’opération pour faire l’assemblage de
données : X méthode actuelle :
les variances
√sX2 / n1 + sY2 / n2
plusieurs composants. Les données suivantes furent obtenues pour comparer la la méthode actuelle
si
( X - Y ) - ( µX - µ Y )
µX - µY : X - Y ± T1 – α/2, n1 + n2 - 2 Sp [ 1/ n1 + 1/ n2 ] 0.5
solution :
24
Y = ∑ Yi / n2
moyennes
SX2 = ∑ ( X i – X ) 2 / ( n1 - 1 )
que les ampoules de type Y ?
Cas E :
22
U
Y1, Y2, … , Yn2
échantillons indépendants
X = ∑ Xi / n1
S p2 =
24
U
X1, X2, … , Xn1
Y : n=9 σ = 81 Y = 970 selon la formule ci haut et la table de la gaussienne centrée réduite et z 0.975 = 1.96
σ
0.06
0.04
0.00
µX - µY : 1050 – 970 ± 1.96 ( 1282 / 16 + 812 / 9 )0.5 = 80 ± 82.1 = ( - 2.1, 162.9 ) question
GAUSS
0.08
Exemple 10 : calculer un intervalle de confiance avec coefficient de confiance 0.95
Y ~ N ( µY, σ2)
0.10
GAUSS
µX - µY : X - Y ± Z 1 – α /2 [σX2 / n1 + σY2 / n2 ]
0.14
0.12
0.5
Exemple 12 : OTHM ex. 6.25 p 195 comparaison de la force de tension de rupture ( psi x1000) de 2 types d’acier
2
données
t 0.975, 20 = 2.08
acier X : n1 = 16
X = 74.6
sx2 = 3.5
acier Y : n2 = 13
Y = 70.2
sY2 = 19.2
intervalle de confiance à 90%
µX - µY : ( 55 – 40 ) ± 2.08 * 8.48 ( 1 / 10 + 1 / 7 ) 0.5 = 15 ± 4.08 = (10.92, 19.08 )
ν = min ( 15, 12) = 12
µX - µY : ( 74.6 – 70.2 ) ± 1.78 ( 3.5 / 16 + 19.2 / 13 ) 0.5 intervalle de confiance à 99%
question : la nouvelle méthode réduit- elle le temps moyen d’assemblage ?
-
-
ν = min ( 15, 12) = 12
t 0.95, 12 = 1.78
= 4.4 ± 2.3 = ( 2.1, 6.7 ) t 0.995, 12 = 3.05
µX - µY : ( 74.6 – 70.2 ) ± 3.05 ( 3.5 / 16 + 19.2 / 13 ) 0.5 = 4.4 ± 4.0 = ( 0.4, 8.4 ) 6 - 23 Bernard CLÉMENT, P h D
6 - 24 Bernard CLÉMENT, P h D
26
MTH 2301 Méthodes statistiques en ingénierie
MTH 2301 Méthodes statistiques en ingénierie
Définition d’un loi du Khi-deux Une variable aléatoire
χ2
Table des quantiles d’une loi Khi-deux
dont la densité de probabilité est définie par
f χ2 ( u ) = c( ν ) u ( ν / 2) - 1 exp ( - u / 2 )
Quantile de la loi Khi-deux
0
View more...
Comments