1. Couples de variables aléatoires

January 16, 2018 | Author: Anonymous | Category: Mathématiques, Statistiques et probabilités
Share Embed Donate


Short Description

Download 1. Couples de variables aléatoires...

Description

S3 Maths 2015-2016

Statistique

Couples et vecteurs aléatoires réels

Université de Picardie Jules Verne UFR des Sciences

2015-2016

Licence mention Mathématiques - Semestre 3 Statistique

Couples et vecteurs aléatoires réels - Théorèmes limites Dans ce chapitre on présente des résultats utiles au développement de la théorie de l’échantillonage.

1. Couples de variables aléatoires 1.1. Exemples Lorsqu’on doit étudier simultanément deux variables aléatoires X et Y, définies respectivement sur deux espaces probabilisés 1 , A 1 , P 1 et 2 , A 2 , P 2 , la définition théorique de la situation doit utiliser un espace qui "englobe" 1 et 2 , que l’on appelle espace produit. A un niveau élémentaire, il suffit de connaître la loi conjointe des deux variables aléatoires, c’est-à-dire l’ensemble des probabilités - P X, Y x, y P X x Y y dans le cas discret - F X,Y x, y P X x Y y dans le cas continu. 1) On lance deux fois de suite la même pièce équilibrée portant le chiffre 1 sur Pile et 0 sur Face. On désigne respectivement par X et Y le chiffre obtenu aux 1er et 2ème lancer. On obtient alors la loi conjointe suivante : X\Y 1 0 1 1 1 4 4 1 1 0 4 4 1 On a par exemple P X 1 Y 0 . 4 2) On dit qu’un couple X, Y de variables aléatoires à densité suit la loi Uniforme (à deux dimensions) sur le rectangle a, b c, d s’il admet pour densité de probabilité la fonction f X,Y définie sur 2 par : 1 si a x b et c y d b a d c f X,Y x, y 0 sinon Cette loi modélise le choix aléatoire et équiprobable d’un point M dans un rectangle de dimensions b a et d c de façon que la probabilité pour que M se trouve dans une région donnée R du rectangle soit proportionnelle à l’aire de cette région : aire R PM R aire rectangle x

On peut alors calculer F

X,Y

x, y

P X

x

Y

y

y

f

X,Y

u, v dv du.

1.2. Loi conjointe et lois marginales dans le cas discret. Soit X, Y un couple de v.a.r. discrètes. Les lois de probabilité de X et de Y sont la donnée de : - X X x i , i I , avec I et Y Y y j , j J , avec J ; - pour tous i I, j J, p i P X x i et p j P Y y j . La loi de probabilité de X, Y est la donnée de : - X,Y x i , y j , i I, j J ; X Y xi, yj P X xi Y yj . - pour tous i I, j J, p i,j P X, Y Il est possible que certains couples x i , y j soient de probabilité nulle (valeurs de X et Y incompatibles).

Stéphane Ducay

1

S3 Maths 2015-2016

Statistique

Couples et vecteurs aléatoires réels

Définitions. i L’application P

X,Y

X

:

Y

xi, yj X

ii Les applications P X :

0, 1

est appelée loi conjointe du couple X, Y .

p i,j 0, 1

et P Y :

xi pi X, Y . Ce sont les lois de probabilité P X et P Y de X et Y. Proposition (admise). Avec les notations précédentes, on a : i pour tout i I, p i p i,j . ii pour tout j

J, p

Y

0, 1

yj

p

p i,j .

j

j J

sont appelées lois marginales de

j

iii

i I

p i,j

1.

i I j J

Ainsi, la loi conjointe du couple X, Y détermine complètement chacune des lois marginales. Nous verrons plus loin que la réciproque n’est pas vraie. Proposition (admise). Avec les notations précédentes, pour toutes parties A et B de , on a : P X A Y B P X xi Y yj p i,j . xi A yj B

xi A yj B

Représentation de la loi conjointe et des lois marginales. X\Y

y1

yj

x1

p 1,1

p 1,j

p1

PX

x1

xi

p i,1

p i,j

pi

PX

xi

loi de Y p

1

PY

p

y1

j

loi de X

PY

1

yj

Exemple. Une urne contient 3 boules blanches et 4 boules noires. On tire deux boules de l’urne. Soit X la variable aléatoire égale à 1 si la première boule est blanche, à 0 sinon. Soit Y la variable aléatoire égale à 1 si la deuxième boule est blanche, à 0 sinon. On distingue les deux types de tirage avec ou sans remise.

X\Y 0 1 loi de Y

tirages avec remise

tirages sans remise

0 16 49 12 49 4 7

loi de X 4 7 3 7

X\Y

1

loi de Y

1 12 49 9 49 3 7

0 1

0 12 42 12 42 4 7

1 12 42 6 42 3 7

loi de X 4 7 3 7 1

On constate que les lois marginales sont identiques dans les deux cas, alors que les lois conjointes sont différentes. Cela illustre bien le fait que la donnée des seules lois marginales ne suffit pas pour obtenir la loi conjointe.

1.2. Indépendance Un cas très important, en théorie et en pratique, est celui des variables aléatoires indépendantes. Définition. Soient X et Y deux variables aléatoires réelles. On dit qu’elles sont indépendantes si l’on a, pour tous réels x et y : -P X x Y y P X x P Y y dans le cas discret. -P X x Y y P X x P Y y dans le cas continu. Exemples Dans les exemples du paragraphe 1.1. et dans le cas avec remise ci-dessus, X et Y sont indépendantes. Stéphane Ducay 2

S3 Maths 2015-2016

Statistique

Couples et vecteurs aléatoires réels

1.3. Opérations sur une ou deux variables aléatoires 1.3.1. Changement d’origine et d’échelle Il arrive souvent que l’on effectue une transformation affine X aX b sur une variable aléatoire X, a étant le paramètre de changement d’échelle, et b le paramètre de changement d’origine. Il est important de savoir comment se comportent les paramètres associés à cette nouvelle variable. On a les résultats suivants : E aX b aE X b ; Var aX b a 2 Var X ; aX b |a| X . Une variable aléatoire d’espérance nulle est appelée variable aléatoire centrée ; une variable aléatoire d’écart-type 1 est appelée variable aléatoire réduite. X EX Ainsi, à toute variable aléatoire X d’écart-type non nul, on peut associer la variable aléatoire X centrée réduite. Cette transformation est indispensable pour l’utilisation de la plupart des tables (comme celle de la loi normale). 1.3.2. Somme et produit de deux variables aléatoires Propriétés. Soient X et Y deux variables aléatoires réelles admettant une espérance mathématique et une variance. 1) X Y et XY sont des variables aléatoires. 2) On a toujours E X Y EX EY . 3) Si X et Y sont indépendantes, alors E XY E X E Y et Var X Y Var X Var Y .

1.4. Covariance. Coefficient de corrélation Lorsqu’on considère deux variables aléatoires simultanément, il faut définir un indicateur pour leur liaison (on pourrait aussi dire leur dépendance), qui viendra compléter les paramètres qui les caractérisent chacune séparément (espérance mathématique, variance, écart-type). Définitions et propriétés. Soient X et Y deux variables aléatoires réelles admettant une espérance mathématique et une variance. On appelle covariance de X et Y le réel Cov X, Y E X EX Y EY E XY E X E Y . Cov X, Y Cov X, Y On appelle coefficient de corrélation linéaire de X et Y le réel X,Y . X Y Var X Var Y De même que la variance de X est homogène à X 2 et la variance de Y à Y 2 , la covariance de X et Y est homogène au produit XY. On en déduit immédiatement que le coefficient de corrélation de X et Y est un nombre sans dimension. Ces principales propriétés sont les suivantes : - on a toujours 1 1 X,Y - si X et Y sont indépendantes, alors X,Y 0 Cov X, Y ; mais la réciproque est fausse : il peut se trouver (par hasard !) que X,Y 0 Cov X, Y sans que X et Y soient indépendantes. - on a | X,Y | 1 si et seulement si il existe une relation affine entre Y et X, c’est-à-dire Y aX b ; si | X,Y | est proche de 1, X et Y prennent des valeurs "peu" dispersées par rapport à une liaison affine. Par ailleurs, de façon générale, on a Var X Y Var X Var Y 2Cov X, Y .

2. Vecteurs aléatoires. Considérant n variables aléatoires réelles X 1 , X 2 , ..., X n , on peut généraliser "assez facilement" les notions de loi conjointe et d’indépendance (mutuelle), et les opérations de somme et produit. On a en particulier n

E

n

n

Xi i 1

E X i , et lorsque les X i sont indépendantes, Var i 1

n

on a Var

Var X i

i 1

X

i 1

n

Xi

2

i 1

n

Xi

Var X i . De façon générale, i 1

Cov X i , X j . On peut de plus démontrer les résultats suivants. 1 i j n

1) a) Si X et Y sont deux variables aléatoires indépendantes de lois Binomiales B n 1 ; p et B n 2 ; p , alors Y suit la loi B n 1 n 2 ; p . b) Si X 1 , X 2 , ..., X m sont m variables aléatoires indépendantes de lois Binomiales B n 1 ; p , B n 2 ; p , ..., m

B n m ; p , alors

X i suit la loi Binomiale B n 1

n2

nm; p .

i 1

c) Si X 1 , X 2 , ..., X n sont n variables aléatoires indépendantes de même loi Binomiale B 1; p n

(c’est-à-dire Bernoulli B p ), alors

X i suit la loi Binomiale B n; p . i 1

Stéphane Ducay

3

S3 Maths 2015-2016

Statistique

Couples et vecteurs aléatoires réels

2) a) Si X et Y sont deux variables aléatoires indépendantes de lois Normales N 2 2 alors X Y suit la loi N 1 2; 1 2 . b) Si X 1 , X 2 , ..., X n sont n variables aléatoires indépendantes de lois Normales N n

N

n;

n

X i suit la loi N

, alors

1

2 1

n;

2

2 2

2 n

1;

1;

et N

1

1

,N

2;

2;

2

,

2

, ...,

.

i 1

n

c) Si X 1 , X 2 , ..., X n sont n variables aléatoires indépendantes de même loi Normale N ;

, alors

Xi i 1

suit la loi N n ;

n .

3. Convergence 3.1. Formule des épreuves répétées On considère une épreuve aléatoire à laquelle est associé un espace probabilisé , A, P , et une variable aléatoire réelle X. Si l’on répète n fois, de façon indépendante, cette épreuve, on obtient une situation d’épreuves répétées, à laquelle est associée une suite X 1 , X 2 , ..., X n de n variables aléatoires qui sont : - définies sur le même espace probabilisé , A, P ; - de même loi ; - indépendantes (mutuellement). On dit parfois que les X i sont des copies (indépendantes) de la variable aléatoire parente X. Supposons que X admette une espérance mathématique et un écart-type 0 (c’est-à-dire de variance n

2

Xn

). Il en est alors de même pour les X i . Définissons les variables aléatoires S n 1 n

X i (somme des X i ) et i 1

n

X i (moyenne des X i ). On a alors les résultats suivants : i 1

E Sn

n , Var S n

E Xn

, Var X n

2

n

;

Sn

n ;

Xn

2

n n

Exemple On effectue une expérience aléatoire au cours de laquelle un évènement A a la probabilité p de se réaliser. Considérant la variable aléatoire X qui, une fois l’expérience réalisée, prend la valeur 1 si A est réalisé et 0 sinon, on a X 0, 1 , P X 1 p et P X 0 1 p. On dit que X suit la loi de Bernoulli B p ; on peut remarquer qu’il s’agit de la loi Binomiale B 1, p . On parle alors d’épreuve de Bernoulli. On a de plus EX p et Var X p1 p . Répétant n fois cette même expérience aléatoire, et désignant par X i la variable aléatoire qui prend la valeur 1 si A est réalisé au cours de la i-ème expérience, et 0 sinon, alors on a bien une suite X 1 , X 2 , ..., X n de n variables aléatoires qui sont de même loi de Bernoulli B p que X et indépendantes (mutuellement). n

La variable aléatoire S n

X i , qui désigne alors le nombre de réalisations de A au cours des n i 1

expériences, suit la loi Binomiale B n, p . On a bien E S n np nE X et Var S n

np 1

p

nVar X .

3.2. Loi faible des grands nombres 3.2.1. Inégalité de Bienaymé-Tchebychev Le problème est de donner une consistance quantitative à la remarque déjà faite que, plus l’écart-type d’une variable est faible, plus sa distribution est concentrée autour de sa moyenne. Inégalité de Bienaymé-Tchebychev Soit X une variable aléatoire espérance mathématique 1. Alors, pour tout réel t 0, P |X | t t2

Stéphane Ducay

et un écart-type .

4

S3 Maths 2015-2016

Statistique

Couples et vecteurs aléatoires réels

3.2.2. Loi faible des grands nombres Etant donnée une situation d’épreuves répétées, auxquelles sont asociées les moyennes (variables aléatoires) X n , la propriété exprimée par le théorème suivant est la convergence en probabilité de la suite X n vers la variable aléatoire égale à l’espérance mathématiques . Ce théorème se démontre de façon simple à partie de l’inégalité de Bienaymé-Tchebychev. Théorème Soit une suite infinie X i de variables aléatoires indépendantes, de même espérance mathématique de même écart-type . Alors, pour tout réel t 0, on a nlim P |X n 0. | t t Xn t 1. Ce qui équivaut à nlim P

et

Il faut comprendre qu’il s’agit de convergence en probabilité, qui n’est pas la convergence des fonctions usuelles. Il est toujours possible que l’écart t oit dépassé pour de très grandes valeurs de n, mais c’est de plus en plus improbable.

3.3. Théorème central limite Dans le chapitre précédent, on a déjà vu l’approximation de la loi Binomiale par la loi Normale. Ceci montre qu’une somme de variables aléatoires indépendantes de même loi de Bernoulli peut être approchée par la loi Normale. Ce résultat est en fait plus général, et s’applique à toute autre loi que celle de Bernoulli. Théorème Soit une suite infinie X i de variables aléatoires indépendantes, de même espérance mathématique de même écart-type . Xn Sn n Soit la variable aléatoire Z n et soit F Z n sa fonction de répartition. n n x 1 e t22 dt lim P Z n x x . Alors, pour tout réel x, on a nlim F Z n x n 2

et

Ainsi, si X 1 , X 2 , ..., X n sont n variables aléatoires indépendantes de même loi espérance mathématique X et de même écart-type , on dira que lorsque n est suffisamment grand, n suit approximativement la loi n normale N 0; 1 , autrement dit que X n suit approximativement la loi normale N

;

. n A noter que grâce aux résultats du paragraphe 2. si X 1 , X 2 , ..., X n sont n variables aléatoires indépendantes n

, alors X n suit (exactement) la loi normale N

de même loi Normale N ;

somme de n variables aléatoires indépendantes de même loi normale N ;

;

n

. En effet, n

donc

X i suit la loi normale i 1

N

;

1 normale N 1 nn ; n

Stéphane Ducay

2

2

n

2

2

N

N n ; n ;

n

2

. On en déduit que X

X i est une i 1

1 n

n

X i suit la loi i 1

.

5

S3 Maths 2015-2016

Statistique

Couples et vecteurs aléatoires réels

4. Exercices Exercice 1. Dans un grand magasin, l’étude du mode de paiement en fonction du montant des achats a permis d’établir, pour chaque client se présentant à une caisse, les probabilités suivantes : PX 0 Y 0 0, 4 , P X 0 Y 1 0, 3 , PX 1 Y 0 0, 2 et P X 1 Y 1 0, 1 où X représente la variable aléatoire prenant la valeur 0 si le montant des achats est inférieur ou égal à 50 euros, prenant la valeur 1 sinon, et Y la variable aléatoire prenant la valeur 0 si la somme est réglée par carte bancaire, prenant la valeur 1 sinon. Un client se présente à une caisse. 1) Déterminer les lois de X et Y et vérifier que la probabilité que le client règle par carte bancaire est égale à p 0, 6. 2) Calculer la covariance du couple X, Y . Les variables aléatoires X et Y sont-elles indépendantes ? 3) Quelle est la probabilité que la somme réglée soit supérieure strictement à 50 euros sachant que le client utilise un autre moyen de paiement que la carte bancaire ? Exercice 2. On suppose que dans une production donnée, chaque objet choisi au hasard a une probabilité p 0, 1 d’être défectueux, et donc a une probabilité 1 p de ne pas l’être (c’est-à-dire d’être en bon état). Ceci peut être représenté par une variable aléatoire X de loi de Bernoulli B p : X 1 si l’objet est défectueux, X 0 sinon. En vue d’estimer p (voir le chapitre suivant), on choisit dans la production, au hasard et avec remise, un échantillon de n objets. On définit ainsi un vecteur aléatoire X 1 , . . . , X n où chaque X i indiquant si le i-ème objet est défectueux ou pas. Les variables X i sont donc de même loi que X et indépendantes. n

1) Rappeler la loi de N

X i ; rappeler son espérance et sa variance. Que réprésente N ? i 1

2) Soit k un entier tel que 0 k n. Déterminer la valeur de p de p pour laquelle la probabilité P N k est maximale. On dira que p est l’estimation de maximum de vraisemblance de p étant donnée l’observation N k. N . Vérifier que E F n p (on dit que F n est un estimateur sans biais de p) et calculer 3) On pose F n n Var F n en fonction de p et n. 4) Rappeler le théorème central limite puis la loi Normale approchant la loi de F n . Exercice 3. Lors d’un grand départ en congés, le nombre de véhicules X i,j qui arrivent à une barrière de péage d’une autoroute en une minute j d’une heure i comprise entre 16 heures et 20 heures suit une loi non spécifiée mais de moyenne connue m i,j 15 et d’écrt-type connu i,j 10. Soit X le nombre de véhicules arrivant à la barrière de péage pendant les 4 heures de trafic de pointe (16 4

60

heures à 20 heures). On a alors X

X i,j . i 1 j 1

1) Déterminer E X et Var X . 2) En appliquant le théorème de la limite centrale, calculer la probabilité que le nombre de véhicules arrivant à la barrière de péage pendant la période de pointe soit inférieure à 3500 (la période est alors considérée comme "fluide"). 3) Une étude a permis de déterminer que, parmi les véhicules qui arrivent à la barrière de péage pendant la période de pointe, un véhicule sur six emprunte le péage "abonné" de la barrière de péage (qui ne comporte qu’un seul péage "abonné"). Soit Y le nombre de véhicules qui empruntent le péage "abonné" au cours de la période de pointe. Calculer E Y et Var Y . 4) Le péage "abonné" est saturé lorsqu’au cours de la période de pointe se présentent plus de 660 véhicules à ce péage. Calculer la probabilité que le péage "abonné" soit saturé au cours de la période de pointe.

Stéphane Ducay

6

View more...

Comments

Copyright � 2017 NANOPDF Inc.
SUPPORT NANOPDF