Statistique élémentaire avec R Partie 1 : Probabilités, Statistiques
Short Description
Download Statistique élémentaire avec R Partie 1 : Probabilités, Statistiques...
Description
Statistique élémentaire avec R Partie 1 : Probabilités, Statistiques Descriptives, Estimation
Julien JACQUES Université Lumière Lyon 2
1 / 64
Plan
Notions de probabilités
Statistiques descriptives
Estimation
2 / 64
Plan Notions de probabilités Généralités Variables aléatoires discrètes et lois associées Variables aléatoires continues et lois associées Liaison entre deux variables aléatoires quantitatives Statistiques descriptives Description d’une variable quantitative Description d’une variable qualitative Description conjointe de plusieurs variables Estimation Estimation ponctuelle Intervalles de confiance 3 / 64
Probabilités Le formalisme
E : expérience aléatoire Ω : ensemble des résultats possibles de E (univers) A ∈ Ω : événement
Opérations sur les événements
union A ∪ B : A ou B (ou les 2) est réalisé
intersection A ∩ B : A et B sont réalisés en même temps si A ∩ B = ∅, A et B sont incompatibles ¯ : A n’est pas réalisé complémentaire A
Propriété : A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C) 4 / 64
Probabilités Définition d’une probabilité Probabilité :
P : Ω → [0, 1] A → P(A)
où P(A) ≃ évaluation des chances de réalisation de A lors d’une expérience aléatoire. 0 ≤ P(A) ≤ 1 pour tout A ∈ Ω
P(Ω) = 1 A, B ∈ Ω tels que A ∩ B = ∅ : P(A ∪ B) = P(A) + P(B) on dit que A et B sont incompatibles
5 / 64
Probabilités Propriétés
P(∅) = 0 ¯ = 1 − P(A) P(A)
si A ⊂ B : P(A) ≤ P(B) si A ∩ B 6= ∅ : P(A ∪ B) = P(A) + P(B) − P(A ∩ B)
Quelques définitions
probabilité conditionnelle que A soit réalisé sachant que B l’est P(A|B) =
P(A ∩ B) P(B)
indépendance : A et B sont indépendants si P(A|B) = P(A) ⇒ P(A ∩ B) = P(A)P(B) 6 / 64
Probabilités
Formule des probabilités totales Soit A1 , A2 , . . . , An un système complets d’événements, i.e. :
Ai ∩ Aj = ∅ pour tout i 6= j, A1 ∪ A2 ∪ . . . ∪ An = Ω.
Alors pour tout B :
P(B) =
n X i=1
7 / 64
P(B ∩ Ai )
Probabilités
Formules de Bayes P(A|B) =
P(B|A)P(A) P(B)
et si A1 , A2 , . . . , An est un système complets d’événements P(B|Ai )P(Ai ) P(B|Ai )P(Ai ) = Pn P(Ai |B) = Pn i=1 P(B ∩ Ai ) i=1 P(B|Ai )P(Ai )
8 / 64
Probabilités Calculer une probabilité Lorsqu’on sait dénombrer les événements : P(A) =
nombre de cas favorables nombre de cas possibles
valide lorsque tous les cas sont équiprobables
Dénombrement
n! = 1 × 2 × . . . × n (nombre de permutations de n objets) : nombre de façons de ranger n objets Cnk (combinaisons de k parmi n) : nombre de choix possibles de k objets parmi n n! Cnk = k !(n − k )! 9 / 64
Variables aléatoires Variable aléatoire X :Ω→E
Ω : ensemble d’événements possibles ou d’individus
E : valeurs possibles de X
Les différents types de variables aléatoires
quantitative
discrète : nombre de clients E = {1, 2, 3, ...} continue : taille, poids E = R
qualitative
10 / 64
nominale : couleur des yeux E = {bleu, vert, noir , ...} ordinale : mention au BAC E = {P, AB, B, TB...}
Plan Notions de probabilités Généralités Variables aléatoires discrètes et lois associées Variables aléatoires continues et lois associées Liaison entre deux variables aléatoires quantitatives Statistiques descriptives Description d’une variable quantitative Description d’une variable qualitative Description conjointe de plusieurs variables Estimation Estimation ponctuelle Intervalles de confiance 11 / 64
Variables aléatoires quantitatives discrètes avec E = {x1 , . . . , xk }
X :Ω→E
Distribution (loi) de X X∼
x1 p1
... ...
xi pi
... ...
xk pk
P
où pi = P(X = xi ) ( ki=1 pi = 1) On supposera (par convention) x1 ≤ . . . ≤ xi ≤ . . . ≤ xk .
12 / 64
Caractéristiques d’une variable discrète Fonction de répartition 0 p1 p1 + p2 FX (x ) = P(X ≤ x ) = 1
13 / 64
si x < x1 si x1 ≤ x < x2 si x2 ≤ x < x3 .. . si x ≥ xk
Caractéristiques d’une variable discrète Espérance
E[X ] =
k X
pi xi
i=1
valeur théorique moyenne à laquelle on peut s’attendre pour X Propriétés on note E[X ] = µ
si X et Y sont deux variables aléatoires, et a une constante : E[aX + Y + b] = aE[X ] + E[Y ] + b E[XY ] 6= E[X ]E[Y ] sauf si X et Y sont indépendantes
14 / 64
Caractéristiques d’une variable discrète Variance V (X ) = E[(X − E[X ])2 ] =
k X i=1
pi (xi − µ)2 =
k X i=1
pi xi2 − µ2
moyenne des carrés des écarts de X à sa moyenne µ Propriétés :
on note V (X ) = σ 2 p on appelle écart-type : σ = V (X )
V (a + X ) = V (X ) et V (aX ) = a2 V (X ) V (X + Y ) 6= V (X ) + V (Y ) sauf si X et Y sont indépendantes
15 / 64
Exemples de lois discrètes Soit A ∈ Ω tel que P(A) = p.
Bernoulli B(p)
On réalise une expérience aléatoire E et on définit X = 1 si A est réalisé, 0 sinon X∼
E[X ] = p
V (X ) = p(1 − p)
16 / 64
0 1−p
1 p
Exemples de lois discrètes Soit A ∈ Ω tel que P(A) = p.
binomiale B(n, p)
On répète n fois de façon indépendante et dans les mêmes conditions l’expérience aléatoire E X = nombre de fois où A est réalisé.
X∼
0 p0
1 p1 . . .
... pn
n
avec pj = P(X = j) = Cnj pj (1 − p)n−j Propriétés: • E[X ] = np • V (X ) = np(1 − p) 17 / 64
Exemples de lois discrètes Poisson P(λ)
On compte un nombre d’événements A indépendants se produisant dans un intervalle de temps fixé X = nombre d’événements A réalisés. X ∈N j avec P(X = j) = e−λ λj! Propriétés: • E[X ] = λ • V (X ) = λ
18 / 64
Exercice sur la loi binomiale
Lancer de dé
je lance un dé non truqué. Quelle est la probabilité d’obtenir 6 ? je lance deux dés non truqués. Quelle est la probabilité d’obtenir au moins un 6 ? je lance dix dés non truqués. Quelle est la probabilité d’obtenir au moins un 6 ?
19 / 64
Plan Notions de probabilités Généralités Variables aléatoires discrètes et lois associées Variables aléatoires continues et lois associées Liaison entre deux variables aléatoires quantitatives Statistiques descriptives Description d’une variable quantitative Description d’une variable qualitative Description conjointe de plusieurs variables Estimation Estimation ponctuelle Intervalles de confiance 20 / 64
Variables aléatoires quantitatives continues X :Ω→E
avec E ⊆ R
P(X = x) = 0 pour tout x ∈ E car E non dénombrable. On s’intéresse plutôt à P(X ∈ [a, b]).
Distribution et fonction de densité
X est caractérisée par sa fonction de densité fX : R → R+ P(X ∈ [a, b]) = P(X ∈]a, b]) =
21 / 64
Z
a
b
fX (x )dx
Variables aléatoires quantitatives continues X :Ω→E
Fonction de répartition
avec E ⊆ R
X peut également être caractérisée par sa fonction de répartition FX : R → [0, 1] Z a fX (x )dx P(X ≤ a) = P(X < a) = −∞
22 / 64
Caractéristiques d’une variable continue Espérance
E[X ] =
Z
+∞
x fX (x )dx = µ
−∞
valeur théorique moyenne à laquelle on peut s’attendre pour X R +∞ De plus, pour toute fonction h : E[h(X )] = −∞ h(x )fX (x )dx
Variance
V (X ) =
Z
+∞
−∞
(x − µ)2 fX (x )dx =
Z
+∞
−∞
x 2 fX (x )dx − µ2
moyenne des carrés des écarts de X à sa moyenne µ 23 / 64
Caractéristiques d’une variable continue Quantile On appelle quantile d’ordre α, le nombre qα tel que : P(X ≤ qα ) = α
et
P(X ≤ qα ) = 1 − α
Pour une loi discrète, il peut exister une infinité de valeur respectant ces deux conditions. On prendra par convention la plus petite. Pour une loi continue, les deux égalités sont vérifiées.
Médiane On appelle médiane le quantile d’ordre α = 50%.
24 / 64
Exemple de loi continue : la loi normale normale N (µ, σ 2 )
Densité de la loi normale (gaussienne) de paramètres µ et σ 2 : 2 ! 1 x −µ 1 fX (x ) = √ exp − 2 σ σ 2π Propriétés : • E[X ] = µ • V (X ) = σ 2 • symétrie : P(X < µ − a) = P(X > µ + a)
25 / 64
Exemple de loi continue : la loi normale Cas particulier normale centrée réduite N (0, 1)
Il existe des tables permettant de lire P(X < u) pour u > 0. La fonction pnorm de R donne également P(X < u) pour u donné.
Exemples :
26 / 64
P(X < 1.6449) P(X < 1.96)
= =
95% 97.5%
Exemple de loi continue : la loi normale Cas particulier normale centrée réduite N (0, 1)
La fonction qnorm donne la valeur du quantile d’ordre α, souvent notée uα pour la loi normale centrée réduite.
27 / 64
Exemple de loi continue : la loi normale
Utilité de la N (0, 1) Si X ∼ N (µ, σ 2 )
Z =
X −µ ∼ N (0, 1) σ
d’où P(X < a) = P et on utilise la table.
28 / 64
X −µ a−µ < σ σ
a−µ =P Z < σ
Exercice sur la loi normale
Calcul de probabilité normale Soit X ∼ N (2, 4). Calculer, à l’aide des tables statistiques P(X = 2)
P(X > 2) et P(X ≥ 2) P(0 < X < 4) et P(−2 < X < 6) Soit Y ∼ N (0, 1). Quel lien y-a-t’il entre P(X > 4) et P(Y > 1) ?
29 / 64
Exemple de loi continue : la loi exponentielle exponentielle E(λ)
Modélise des durées (de vie en fiabilité, pour matériel sans usure ni fatigue) Densité de la loi exponentielle de paramètre λ : fX (x ) = λe−λx si x > 0
Propriétés: • E[X ] = 1/λ • V (X ) = 1/λ2 30 / 64
Exemple de loi continue : la loi de Weibull Weibull W(α, β)
Modélise des durées de vie en fiabilité Densité de la loi de Weibull de paramètre α, β : α fX (x ) = β
α−1 α x λe−(x/β) si x > 0 β
Propriétés: • α lié au vieillissement: α = 1 ⇒ loi E(1/β), α > 1 ⇒ matériel qui se fatigue • β lié à la durée de vie médiane: β = mediane/((ln 2)1/α ) 31 / 64
Exemple de loi continue : la loi de Gumbel Gumbel standard G
Modélise des valeurs extrêmes (crues/magnitudes maximales annuelles...) Densité : fX (x ) = e−x−e
−x
si x > 0
Fonction de répartition : FX (x ) = p(X < x ) = e−e
32 / 64
−x
si x > 0
Plan Notions de probabilités Généralités Variables aléatoires discrètes et lois associées Variables aléatoires continues et lois associées Liaison entre deux variables aléatoires quantitatives Statistiques descriptives Description d’une variable quantitative Description d’une variable qualitative Description conjointe de plusieurs variables Estimation Estimation ponctuelle Intervalles de confiance 33 / 64
Liaison entre deux variables aléatoires quantitatives Covariance
On définit la covariance entre deux variables aléatoires X et Y par Cov (X , Y ) = E[(X − µX )(Y − µY )] = E[XY ] − µX µY . Interprétation : Exprime la présence d’une relation du type Y = aX + b Cov (X , Y ) > 0 : les variables varient dans le même sens par rapport à leur moyenne, Cov (X , Y ) < 0 : les variables varient en sens inverse,
Cov (X , Y ) = 0 : les variables ne sont pas corrélées linéairement (Attention : cela n’implique pas l’indépendance (sauf si les variables sont normales)
Remarque : Cov (X , X ) = V (X ) 34 / 64
Liaison entre deux variables aléatoires quantitatives
Corrélation
Comme la covariance n’est pas bornée, on définit la corrélation entre deux variables aléatoires X et Y par ρX ,Y = Propriété : ρX ,Y ∈ [−1, 1]
35 / 64
Cov (X , Y ) . σX σY
Liaison entre deux variables aléatoires quantitatives Indépendance Deux variables aléatoires X et Y sont indépendantes si P({X ∈ A} ∩ {Y ∈ B}) = P({X ∈ A})P({Y ∈ B}). Propriétés :
si X et Y sont à densité, X et Y indépendantes ⇒ fX ,Y (x , y ) = fX (x )fY (y ) X et Y indépendantes ⇒ Cov (X , Y ) = 0 = ρX ,Y (Attention :) X et Y indépendantes ⇒ R fX +Y (z) = fX (x ) ⊗ fY (y ) = R fX (u)fY (z − u)du
36 / 64
Liaison entre deux variables aléatoires quantitatives Calcul d’inégalité aléatoire Si X et Y sont indépendantes P(X > Y ) = =
Z
∞
−∞ Z ∞ −∞
Z
x
−∞ Z x
fY (y )fX (x )dxdy fY (y )dy fX (x )dx
−∞
Exemple d’application :
X : resistance d’un matériau Y : force appliquée sur le matériau
P(X > Y ) : probabilité que le matériau résiste
37 / 64
Plan
Notions de probabilités
Statistiques descriptives
Estimation
38 / 64
Notion d’échantillon Soit X la variable aléatoire d’intérêt.
Échantillon
On appelle échantillon toute suite X1 , . . . , Xn de variables aléatoires indépendantes et de même loi que la variable aléatoire X d’intérêt. Exemple : X : taille des individus de la population française X1 , . . . , Xn : taille de n individus choisis au hasard dans la population française.
On notera x1 , . . . , xn l’observation de l’échantillon aléatoire X1 , . . . , Xn .
39 / 64
Plan Notions de probabilités Généralités Variables aléatoires discrètes et lois associées Variables aléatoires continues et lois associées Liaison entre deux variables aléatoires quantitatives Statistiques descriptives Description d’une variable quantitative Description d’une variable qualitative Description conjointe de plusieurs variables Estimation Estimation ponctuelle Intervalles de confiance 40 / 64
Résumés numériques d’une variable quantitative Tendance centrale 1 n
¯ = Moyenne : X
Médiane : valeur M qui partage l’échantillon ordonné en 2
Pn
i=1
Xi
M = X n+1 si n impair, et M = 2
X n2 + X 2n +1 2
en supposant que l’échantillon X1 , . . . , Xn est classé par ordre croissant
Mode : valeur la plus observée (pour variables discrètes)
¯ et M sont des variables aléatoires, leurs observations sur un Rq : X Pn échantillon sont notées x¯ = 1n i=1 xi et m. 41 / 64
Résumés numériques d’une variable quantitative
Dispersion
Variance (empirique) : V 2 = Étendue : Xmax − Xmin
1 n
Pn
i=1 (Xi
¯ )2 −X
Intervalle inter-quartile : [Q1 , Q3 ] où le premier quartile Q1 est la valeur telle qu’1/4 des observations lui soient inférieures et 3/4 supérieures (et l’inverse pour le troisième quartile Q3 )
42 / 64
Résumés numériques d’une variable quantitative
Forme
Pn
1
¯ 3 i=1 (Xi −X ) n/(n−1)V )3
skewness : coefficient d’asymétrie γ1 = n√
kurtosis : coefficient aplatissement γ2 =
(
Propriétés : X ∼ N ⇒ γ = 0 et γ = 3 (0 pour Excel) 1 2
Pn ¯ 4 i=1 (Xi −X ) (n/(n−1))2 V 4
1 n
γ1 > 0 : distribution décalée vers la gauche γ2 > 3 : distribution plus aplatie qu’une gaussienne
43 / 64
Représentation graphique d’une variable quantitative
20
30
40
50
60
70
Boîte à moustaches
trait centré au milieu de la boîte : médiane
la boîte est formée par les 1er quartile q1 et 3ème quartile q3
les moustaches sont définies par les valeurs observées les plus extrêmes dans l’intervalle [q1 − 1.5(q3 − q1 ), q3 + 1.5(q3 − q1 )] ◦ : valeurs extrêmes hors des moustaches
44 / 64
Représentation graphique d’une variable quantitative Histogramme : surface de chaque barre proportionnelle à l’effectif de la classe d’observations correspondante
Density
0.00
0.01
0.02
0.03
0.04
Histogramofdat[,13]
20
30
40
50 data[, 13]
60
70
Rq : si la variable est quantitative discrète, les “barres” sont remplacées par des 45 / 64 “bâtons”.
Représentation graphique d’une variable quantitative Fonction de répartition empirique : Nx n où Nx = #{Xi : Xi ≤ x , 1 ≤ i ≤ n} est le nombre de données inférieures ou égales à X . ecdf(x)
0.0
0.2
0.4
Fn(x)
0.6
0.8
1.0
Fn (x ) =
20
46 / 64
30
40
50 x
60
70
80
Plan Notions de probabilités Généralités Variables aléatoires discrètes et lois associées Variables aléatoires continues et lois associées Liaison entre deux variables aléatoires quantitatives Statistiques descriptives Description d’une variable quantitative Description d’une variable qualitative Description conjointe de plusieurs variables Estimation Estimation ponctuelle Intervalles de confiance 47 / 64
Résumé numérique d’une variable qualitative
Si X est une variable aléatoire qualitative prenant les modalités {m1 , . . . , mp } on s’intéresse à
Nj = #{Xi : Xi = mj , 1 ≤ i ≤ n} : le nombre d’occurrences (effectif) de la modalité mj dans l’échantillon Fi =
48 / 64
Ni n
: la fréquence de la modalité mj dans l’échantillon
Représentation graphique d’une variable qualitative Diagramme en camembert (pie-chart, gauche) et en barres (droite)
A93
A94
A92
A94
A92
A91
A91
A93
0
49 / 64
100
200
300
400
500
Plan Notions de probabilités Généralités Variables aléatoires discrètes et lois associées Variables aléatoires continues et lois associées Liaison entre deux variables aléatoires quantitatives Statistiques descriptives Description d’une variable quantitative Description d’une variable qualitative Description conjointe de plusieurs variables Estimation Estimation ponctuelle Intervalles de confiance 50 / 64
Décrire la liaison entre deux variables quantitatives Numérique : le coefficient de corrélation linéaire Cov (X , Y ) . σX σY Graphique : le nuage de points :
10000 0
5000
data[, 5]
15000
ρX ,Y =
51 / 64
10
20
30
40 data[, 2]
50
60
70
Décrire la liaison entre Y quantitative et X qualitative Numérique : le rapport de corrélation : q RY |X = VX2 /V 2 PR ¯j − Y ¯ )2 exprime la part de variabilité due à X où VX2 = 1n j=1 Nj (Y ¯j étant la moyenne des Y observés lorsque X = jème modalité) (Y
20
30
40
50
60
70
Graphique : le boxplot :
52 / 64
A91
A92
A93
A94
Décrire la liaison entre deux variables qualitatives X : modalités m1 , . . . , mR Y : modalités o1 , . . . , oC
m1 .. . mr .. . mR sommes
o1 N11 .. . Nr 1 .. . NR1 N·1
··· ··· ··· ··· ···
oc N1c .. . Nrc .. . NRc N·c
··· ··· ··· ··· ···
oC N1C .. . NrC .. . NRC N·C
Table : Table de contingence
53 / 64
sommes N1· .. . Nr · .. . NR· n
Décrire la liaison entre deux variables qualitatives Mesure de liaison
le χ2 (non borné): 2
χ =
r =1 c=1
le Φ2 =
χ2 n
Nr · N·c 2 n Nr · N·c n
C R X X Nrc −
# C R X 2 X Nrc =n −1 Nr · N·c "
r =1 c=1
(dépend encore de C et de R) q Φ2 le C de Cramer (∈ [0, 1]) C = inf (R,C)−1 q Φ2 le T de Tschuprow (∈ [0, 1]) T = (R−1)(C−1)
54 / 64
Plan
Notions de probabilités
Statistiques descriptives
Estimation
55 / 64
Notion d’estimation X une variable aléatoire θ un paramètre caractérisant X dans une population donnée. Ex : θ : la moyenne de X , E[X ] = µ θ : la variance de X , V (X ) = σ 2 θ : la proportion de telle modalité, lorsque X est qualitative...
56 / 64
Notion d’estimation X une variable aléatoire θ un paramètre caractérisant X dans une population donnée. Ex : θ : la moyenne de X , E[X ] = µ θ : la variance de X , V (X ) = σ 2 θ : la proportion de telle modalité, lorsque X est qualitative... Généralement, θ n’est pas connu car on ne dispose pas de mesure de X sur toute la population ⇒ on va chercher à estimer θ à partir d’un échantillon X1 , . . . , Xn ⇒ estimation ponctuelle : donner une valeur approchée de θ ⇒ estimation par intervalle : donner un intervalle encadrant la vraie valeur de θ avec une certaine probabilité 56 / 64
Notion d’estimateur
Estimateur
Une statistique T fonction de l’échantillon : T (X1 , . . . , Xn ) dont on appréciera les qualités suivantes :
n→∞
convergent : T (X1 , . . . , Xn ) −→ θ
sans biais : E[T − θ] = 0 de variance V (T ) = E[(T − θ)2 ] minimale
57 / 64
Plan Notions de probabilités Généralités Variables aléatoires discrètes et lois associées Variables aléatoires continues et lois associées Liaison entre deux variables aléatoires quantitatives Statistiques descriptives Description d’une variable quantitative Description d’une variable qualitative Description conjointe de plusieurs variables Estimation Estimation ponctuelle Intervalles de confiance 58 / 64
Estimateur de l’espérance et de la variance Estimateur de l’espérance ¯ = La statistique X
n 1 i=1 n n→∞
P
Xi est le meilleur estimateur de µ
¯ −→ µ convergent : X ¯] = µ sans biais : E[X ¯ ) = σ2 minimale de variance V (X n
59 / 64
Estimateur de l’espérance et de la variance Estimateur de l’espérance ¯ = La statistique X
n 1 i=1 n n→∞
P
Xi est le meilleur estimateur de µ
¯ −→ µ convergent : X ¯] = µ sans biais : E[X ¯ ) = σ2 minimale de variance V (X n
Estimateur de la variance P 1 n−1 2 n→∞
La statistique S 2 =
n i=1 (Xi
convergent : S −→ σ 2 sans biais : E[S 2 ] = σ 2
de variance minimale
¯ )2 est le meilleur estimateur de σ 2 −X
Rq : V 2 vu précédemment est biaisé E[V 2 ] = 59 / 64
n−1 2 n σ
Estimateur d’une proportion On s’intéresse à la proportion p d’individus ayant une certaine caractéristique dans une population.
Estimateur d’une proportion ¯ = F =X
Pn
i=1
Xi
, n où Xi est une v.a. de Bernoulli de paramètre p, définie par : 1 si l’individu i possède la caractère C Xi = 0 sinon.
60 / 64
Plan Notions de probabilités Généralités Variables aléatoires discrètes et lois associées Variables aléatoires continues et lois associées Liaison entre deux variables aléatoires quantitatives Statistiques descriptives Description d’une variable quantitative Description d’une variable qualitative Description conjointe de plusieurs variables Estimation Estimation ponctuelle Intervalles de confiance 61 / 64
Intervalle de confiance sur l’espérance ¯ Loi de X 2
¯ ∼ N (µ, σ ) Xi ∼ N (µ, σ 2 ) ⇒ X n
lorsque les Xi ne sont pas gaussiens ¯ n→∞ Théorème centrale limite : X −→ N (µ,
σ2 n )
Intervalle de confiance sur µ IC1−α (µ) loi normale ou n ≥ 30
62 / 64
σ 2 connue
σ 2 inconnue
[x¯ + u α2 √σn , x¯ − u α2 √σn ]
[x¯ + tn−1, α2 √Sn , x¯ − tn−1, α2 √Sn ]
Intervalle de confiance sur la variance ¯ Loi de X
Xi ∼ N (µ, σ 2 ) ⇒
n−1 2 S σ2
∼ χ2n−1
Intervalle de confiance sur σ 2 IC1−α (σ 2 ) loi normale µ connue nVµ2
[ χ2
n,1− α 2
63 / 64
,
nVµ2 α χ2n , 2
µ inconnue ]
2 [ χ(n−1)s 2 n−1,1− α 2
2
, (n−1)s ] χ2 n−1, α 2
Intervalle de confiance sur une proportion Loi de F
F =
Pn
i=1
n
Xi
avec Xi ∼ B(p) ⇒ nF =
Pn
i=1
Xi ∼ B(n, p)
si n est suffisamment grand (np > 5 et n(1 − p) > 5) : F ∼ N (p,
p(1 − p) ) n
Intervalle de confiance sur p IC1−α (p) np > 5 et n(1 − p) > 5 q q ) f (1−f ) α [f + u α2 f (1−f , f − u n n ] 2 64 / 64
View more...
Comments