Variables aléatoires et Lois de probabilité - Estimation Jean Gaudart Laboratoire d’Enseignement et de Recherche sur le Traitement de l’Information Médicale
[email protected]
Faculté de Médecine Université de la Méditerranée
J Gaudart, LERTIM, Aix-Marseille Université
2011
1
plan 1. Variables Aléatoires 2. Lois de Distribution 2.1 Présentation 2.2 Loi Uniforme 2.3 Loi Normale 2.4 Loi de Student 2.5 Loi du Chi 2 2.6 Loi de Bernoulli et Loi Binomiale 2.7 Loi de Poisson
3. Estimation 3.1 Estimations ponctuelles 3.2 Estimations par intervalle J Gaudart, LERTIM, Aix-Marseille Université
2011
2
Variable Aléatoire Lois de distribution Estimation
Présentation Caractéristiques
1. Variables Aléatoire 1.1 Présentation • Exemples – Age (en années) – Tension artérielle systolique (en mmHg) – Stades de gravités d’une maladie (0-1-2-3-4) – Sexe (Homme/Femme) – Cancer (Présence/Absence) – Nombre de malades – … → Mesures qui varient d’un individu à l’autre J Gaudart, LERTIM, Aix-Marseille Université
2011
3
Variable Aléatoire Lois de distribution Estimation
Présentation Caractéristiques
• Caractériser une variable aléatoire ⇒ statistiques descriptives – – – – – –
Age (en années) Moyenne, variance, % classes d’âges Tension artérielle systolique (en mmHg) Moyenne, variance Stades de gravités d’une maladie (0-1-2-3-4) n, % n, % Sexe (Homme/Femme) Cancer (Présence/Absence) n, % Moyenne, variance, % >k Nombre de malades
J Gaudart, LERTIM, Aix-Marseille Université
2011
4
Variable Aléatoire Lois de distribution Estimation
Présentation Caractéristiques
• Exemple – Pourcentage d’individus par classe d’âge dans la population française, au 1er Janvier 2011 %
Mesure : Age J Gaudart, LERTIM, Aix-Marseille Université
2011
5
Présentation Caractéristiques
Variable Aléatoire Lois de distribution Estimation
1.2 Caractéristiques d’une V.A. • Variables Qualitatives ⇒ Mesure d’une qualité – Sexe (Homme/Femme) – Maladie (Présence/Absence) – Stades de gravité (0-1-2-3-4) Attention aux codes Plusieurs modalités, 1 individu ∈ 1 seule modalité
⇒ Types – Nominal : sans ordre – Ordinale : avec ordre J Gaudart, LERTIM, Aix-Marseille Université
2011
6
Variable Aléatoire Lois de distribution Estimation
Présentation Caractéristiques
⇒ Caractéristiques – – – – –
Nombre d’individus par modalités Pourcentages d’individus par modalités Classe modale, classe médiane Pourcentages d’individus > une classe (VA ordinales) Diagramme bâton
J Gaudart, LERTIM, Aix-Marseille Université
2011
7
Variable Aléatoire Lois de distribution Estimation
Présentation Caractéristiques
• Variables Quantitatives ⇒ Mesure d’une quantité – Âge – TAS – Nombre d’enfants dans une fratrie Plusieurs valeurs, 1 individu = 1 seule valeur
⇒ Types – Continue : ex TAS – Discrète : ex Nombre d’enfants Les VA continues sont souvent discrétisées : Âge en années J Gaudart, LERTIM, Aix-Marseille Université
2011
8
Variable Aléatoire Lois de distribution Estimation
Présentation Caractéristiques
⇒ Caractéristiques – – – –
Moyenne, variance, mode, médiane Nombre ou % d’individus par classes (VA discrétisées) Pourcentages d’individus > une Valeur Histogramme
J Gaudart, LERTIM, Aix-Marseille Université
2011
9
Variable Aléatoire Lois de distribution Estimation
Présentation Lois
2. Lois de distribution 2.1 Présentation Depuis plusieurs siècles, de nombreuses mesures ont été réalisées et caractérisées ⇒Caractéristiques similaires / types de mesures ⇒Classification de types de mesures ⇒Règles ou lois et propriétés mathématiques Exemple: loi Normale
J Gaudart, LERTIM, Aix-Marseille Université
2011
10
• Exemple : Tension Artérielle Systolique n = 58; m=126 mmHg; var=75,9 mmHg²; min=106mmHg; max=143 mmHg
0.00
0.01
0.02
Density
0.03
0.04
0.05
Histogram of TAS
110
120
130
140
TAS4
J Gaudart, LERTIM, Aix-Marseille Université
2011
11
Variable Aléatoire Lois de distribution Estimation
Présentation Lois
f(x)
x
J Gaudart, LERTIM, Aix-Marseille Université
2011
12
Variable Aléatoire Lois de distribution Estimation
2.2 Loi Uniforme ⇒ Caractéristiques
Présentation Loi Uniforme
1 f ( x ) = (b − a ) si a ≤ x ≤ b 0 si non
– min = a, max = b
a+b µ= 2 2 ( b − a) σ² =
12
J Gaudart, LERTIM, Aix-Marseille Université
2011
13
Variable Aléatoire Lois de distribution Estimation
Présentation Loi Normale
2.3 Loi Normale (Laplace – Gauss) f (x ) = ⇒ Caractéristiques – moyenne = µ, variance = σ²
1 x − µ 2 exp − 2 2 2 σ 2σ π 1
n
µ=
∑x i =1
n
n
σ² =
∑ (x i =1
i
i
− µ )²
n
J Gaudart, LERTIM, Aix-Marseille Université
2011
14
Variable Aléatoire Lois de distribution Estimation
Présentation Loi Normale
• cas particulier: la loi Normale centrée réduite µ= 0 et σ²=1
J Gaudart, LERTIM, Aix-Marseille Université
2011
15
Variable Aléatoire Lois de distribution Estimation
Présentation Loi de Student
2.4 Loi de Student (William Gosset) ⇒ Caractéristiques – moyenne = µ, variance = σ², degrés de liberté = ν
J Gaudart, LERTIM, Aix-Marseille Université
2011
16
Présentation Loi du Chi 2
Variable Aléatoire Lois de distribution Estimation
2.5 Loi du Chi 2 (Karl Pearson) ⇒ Caractéristiques – degrés de liberté = ν
µ =ν σ ² = 2ν
J Gaudart, LERTIM, Aix-Marseille Université
2011
17
Variable Aléatoire Lois de distribution Estimation
Présentation Loi Bernoulli / Binomiale
2.6 Loi de Bernoulli et loi Binomiale (Jacques Bernoulli) ⇒ Loi de Bernoulli => loi des variables binaires (succès/échec; 0/1) ⇒Caractéristiques – Probabilité que la mesure prenne la valeur 1 p(X=1)= p p si x = 1 P ( X = x ) = 1 − p si x = 0 0 si non
µ=p σ ² = p (1 − p ) J Gaudart, LERTIM, Aix-Marseille Université
2011
18
Variable Aléatoire Lois de distribution Estimation
Présentation Loi Bernoulli / Binomiale
⇒ Loi Binomiale=> loi du nombre de succès ⇒ Caractéristiques – Probabilité de succès p – Nombre de sujets (nombre d’épreuves) n
µ = np
p (1 − p ) σ² = n
J Gaudart, LERTIM, Aix-Marseille Université
2011
19
Variable Aléatoire Lois de distribution Estimation
Présentation Loi de Poisson
2.7 Loi de Poisson (Siméon-Denis Poisson) ⇒loi des variables de comptage ⇒Caractéristiques – Nombre moyen λ
µ=λ σ² = λ
J Gaudart, LERTIM, Aix-Marseille Université
2011
20
• exemple : SARM, comptage des prélèvements positifs
0.04 0.03 0.00
0.01
0.02
Density
0.05
0.06
Histogram of SAR
15
20
25
30
35
40
45
SARM
J Gaudart, LERTIM, Aix-Marseille Université
2011
21
Théorème central limite Soit Xn une suite de n variable aléatoires de même loi quelconque , de moyenne µ et de variance σ² Si n est grand, M suit une loi Normale de moyenne µ et de variance σ²/n
http://www.aiaccess.net/French/Glossaires/GlosMod/f_gm_central.htm
J Gaudart, LERTIM, Aix-Marseille Université
2011
22
3. Estimation
3.1 Estimation ponctuelle Quelles sont les vraies valeurs, dans la population, lorsqu’on ne possède que des observations faîtes sur un échantillon? Valeur la plus vraisemblable => estimation ponctuelle • Exemples: − TAS moyenne chez un type de patients − % BMI>35 dans la population − Nombre moyen d’infections nosocomiales dans un hôpital J Gaudart, LERTIM, Aix-Marseille Université
2011
23
J Gaudart, LERTIM, Aix-Marseille Université
2011
24
Références Jean Bouyer: éditions INSERM
,
Jean Bouyer: Epidémiologie, méthodes quantitatives, éditions INSERM Coll.: Biostatistiques, éditions Omnisciences
J Gaudart, LERTIM, Aix-Marseille Université
2011
25