Chap.5

January 14, 2018 | Author: Anonymous | Category: Mathématiques, Statistiques et probabilités

Short Description

Download Chap.5...

Description

Principes et Méthodes de la Biostatistique

Chapitre 5

LOI NORMALE ET LOIS DERIVEES A-LA LOI NORMALE Présentation La distribution normale, dite encore de Laplace-Gauss, est pour des raisons qui apparaîtront plus loin, la plus importante des distributions de probabilité. C’est une distribution définie sur R , dont la densité dépend des 2 paramètres μ et σ2, qui sont sa moyenne et sa variance ; l’expression de cette densité, donnée à titre de simple curiosité, est la suivante : ⎛ (x − μ )2 ⎞ 1 2 ⎜ ⎟ f (x, μ,σ ) = exp ⎜ − σ 2π 2σ 2 ⎟⎠ ⎝ (nous n’aurons jamais besoin dans la suite de cette expression, sauf dans le chapitre sur le maximum de vraisemblance). Le graphe de la densité de la loi normale de moyenne nulle et d’écart-type 1, dite loi normale centrée réduite ou standard, f(x ; 0 ; 1) est représenté ci-dessous ; c’est la fameuse courbe en cloche ; de façon générale, la courbe est symétrique autour de la moyenne μ et d’autant plus étalée vers les basses et hautes valeurs de x que la variance σ2 est plus grande.

Densité de la loi normale 0,45 0,4 0,35 0,3 0,25 0,2 0,15 0,1 0,05 0 -4

-2

0

2

4

x

Loi normale et lois dérivées

20

Principes et Méthodes de la Biostatistique

Un premier résultat concernant la distribution normale est que si X est N(μ;σ2) (ce symbole se comprend de lui-même), la variable Y=aX+b, où a et b sont des nombres est aussi normale, de moyenne aμ+b et de variance a2σ2. Ce résultat, toute fonction linéaire d’une variable normale est elle-même normale, est très utile, notamment pour les calculs, car il montre qu’on peut toujours se ramener à la variable normale centrée réduite. En effet, soit X=N(μ ;σ2) et cherchons la probabilité que X soit inférieure ou égale à un nombre donné x0 (c’est, rappelons-le, la fonction de répartition de X − μ x0 − μ X −μ ≤ } . Mais Y= a pour moyenne 0 et pour variance 1, X). Pr{X≤x0}= Pr{

σ

σ

σ

c’est une normale centrée réduite ; la probabilité cherchée est donc Pr{Ya}=0.05 s’obtient, si on fait l’approximation par la loi normale, par a=30+1.645 60 = 42.74, valeur voisine de la valeur exacte 43.77 donnée par la table. L’approximation est donc très bonne. Une autre, meilleure, est indiquée au bas de la table : 2 χ 2n est distribuée normalement avec une moyenne 2 n − 1 . On pourra vérifier que la valeur fournie par cette approximation est 43.49 très près de 43.77. Cependant ces approximations n’ont plus qu’un intérêt historique, les logiciels permettant l’obtention immédiate de résultats exacts. 4) Si X1, X2,…., Xn sont des N(μ ;σ2) indépendantes, la variable aléatoire ⎛ X − μ⎞ 2 X −μ V = ∑⎜ i est ⎟ est un χ2 à n d.d.l. ; c’est évident, puisque chacune des variables i ⎝ σ ⎠ σ i normale centrée réduite. 5) Considérons maintenant deux variables X1 et X2 indépendantes, normales de moyenne μ et de variance σ2 et définissons la variable aléatoire M, moyenne arithmétique de ⎛ X1 − M ⎞ 2 ⎛ X 2 − M ⎞ 2 X1 + X 2 X1 et X2, M= . Cherchons la loi de la variable aléatoire V = ⎜ ⎟ +⎜ ⎟ . ⎝ σ ⎠ ⎝ σ ⎠ 2 ⎛ X1 − X2 ⎞ 2 X1 − X2 X 2 − X1 ⎟ . Mais X1-X2 et X2 − M = , on trouve que V = ⎜ Comme X1 − M = ⎝ σ 2 ⎠ 2 2 X − X2 est une normale de moyenne nulle et de variance 2 σ2. Alors, 1 est une normale centrée σ 2 réduite et V suit un χ2 à 1 d.d.l. Ce résultat peut se généraliser : si X1, X2,…., Xn sont des X + X 2 + .... + Xn N(μ ;σ2) indépendantes, et si M est la variable moyenne arithmétique M= 1 , n ⎛ Xi − M ⎞ 2 ⎟ a une distribution du χ2 à n-1 d.d.l. La démonstration la variable aléatoire V = ∑ ⎜ ⎝ σ ⎠ i n’est pas immédiate, car si les variables Xi-M sont bien normales de moyenne nulle, leur variance n’est pas 1 et elles ne sont pas indépendantes.

Loi normale et lois dérivées

24

Principes et Méthodes de la Biostatistique

C- LA DISTRIBUTION t DE STUDENT Définition

Soit X une variable normale centrée réduite et Y une variable, indépendante de X, qui suit une distribution du χ2 à n d.d.l. X La distribution de la variable aléatoire T = est appelée distribution de t à n d.d.l. Y n La raison de l’introduction de cette variable aléatoire plutôt bizarre, apparaîtra plus loin. Cette distribution est symétrique autour de 0 . Elle est tabulée : on lit par exemple dans la table que Pr{ t 6 > 1.943} = 0.10, Pr{ t 4 > 2.776} = 0.05 … On remarquera que quand n croit, la distribution se rapproche de la distribution normale standard (pour n infini, les valeurs sont celles de la table de la loi normale). Bien entendu, les logiciels permettent les calculs sur la distribution de t.

Deux résultats

1) Si X1, X2, …, Xn sont n variables normales de moyenne μ et de variance σ2 et ∑i Xi 2 et ∑ (Xi − M ) sont indépendantes. Nous indépendantes, les variables aléatoires M = n i 2 ∑ (X i − M ) V σ 2 2 admettrons ce résultat. M et S = i = sont donc évidemment indépendants. n −1 n −1 2) M est normale de moyenne μ et de variance d’autre part V=(n − 1)

S2

σ2

σ2

M−μ ; σ est donc centrée réduite ; n n

suit une loi du χ2 à n-1 d.d.l. et est indépendante de M. D’après la

définition même de la distribution du t de Student, le rapport

M−μ σ n

(n − 1) S 2 (n − 1) σ 2

=

M−μ 2

suit une

S n

loi de t à n-1 degrés de liberté. Le sens concret de ce résultat apparaîtra un peu plus loin.

Loi normale et lois dérivées

25

Principes et Méthodes de la Biostatistique

A SAVOIR

Loi normale :

α

zα

α 2

α 2

εα

Règle des 2 écarts-types : Si X est N(μ; σ 2 ) , X a une probabilité de 95 % d’être compris entre μ ± 2σ .

∑X

i

Théorème central limite : M =

i

n

est N (μ;

σ2 n

) pour n suffisamment grand, quelle que

soit la distribution des X.

∑ (X V=

i

− M)

2

σ2

Si S 2 =

∑ (X

− M)

2

i

i

Loi normale et lois dérivées

est un χ2 à n-1 degrés de liberté.

n −1

,

M−μ S2 n

est un t de Student à n-1 degrés de liberté.

26

Principes et Méthodes de la Biostatistique

Annexe - chapitre 5

Loi normale et lois dérivées

27

Principes et Méthodes de la Biostatistique

Loi normale et lois dérivées

28

Principes et Méthodes de la Biostatistique

Loi normale et lois dérivées

29

Principes et Méthodes de la Biostatistique

Loi normale et lois dérivées

30

Chap.5

Short Description

Description

Comments

We need your help!