Mémoire - ENS Rennes

January 13, 2018 | Author: Anonymous | Category: Mathématiques, Statistiques et probabilités
Share Embed Donate


Short Description

Download Mémoire - ENS Rennes...

Description

Mémoire M2

Leçon 261 Fonction caractéristique et transformée de Laplace d’une variable aléatoire. Exemples et applications. Paul Alphonse Ecole Normale Supérieure de Rennes Professeur encadrant : Jean-Christophe Breton Décembre 2015

Table des matières 1

Fonction caractéristique et transformée de Laplace. 1.1 Transformée de Fourier d’une mesure bornée - Fonction caractéristique. . . . . . . 1.2 Transformée de Laplace d’une variable aléatoire. . . . . . . . . . . . . . . . . . . . . 1.3 Caractérisation de la loi. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

2

Liens avec l’indépendance. 2.1 Caractérisations d’indépendance. . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Inégalité de Hoeffding . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3 Théorème de Bernstein . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4 Opérations sur les transformées de Laplace et les transformées de Fourier.

. . . .

. . . .

. . . .

. . . .

. . . .

3 3 5 6 6 6 7 9 11

3

Liens avec les moments.

11

4

Liens avec la convergence en loi. 4.1 Notion de convergence en loi. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2 Le théorème central limite. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3 Exemples d’utilisation du théorème central limite . . . . . . . . . . . . . . . . . . .

13 14 15 17

1

2015

Mémoire M2 : Leçon 261

2016

Introduction Le rôle des transformées de Fourier et de Laplace est bien connu en analyse et plus particulièrement dans l’étude des équations aux dérivées partielles. Les objets analogues en théorie des probabilités possèdent une importance tout aussi grande puisqu’en particulier elle permettent de caractériser les lois des variables aléatoires. Cependant ce n’est pas leur plus grande force (la fonction de répartition possède elle aussi cette propriété), elles possèdent de plus des propriétés analogues à celles de leurs collègues en analyse. Par exemple, leur comportement vis a vis de la convolution est identique ce qui permet de démontrer des résultats utiles sur l’indépendance des variables aléatoires. La transformée de Fourier des mesures bornées possède elle aussi son théorème d’inversion. De plus, elles possèdent des liens intrinsèques entre leur régularité et l’existence de moments pour les variables aléatoires dont elles caractérisent la loi. Enfin toutes deux ont leur rôle à jouer dans l’étude de la convergence en loi des variables aléatoires, les fonctions caractéristiques intervenant de manière fondamentale dans le théorème de Lévy, qui permet lui-même de démontrer le très célèbre théorème central limite. Le spectre d’utilisations (explicites ou implicites) de ces deux transformées est donc vaste et bien le connaitre est fondamental.

Notations Dans toute la leçon, on fixe un entier naturel non nul d. Toutes les variables aléatoires manipulées seront à valeurs dans Rd . Dans le cas où d = 1, on parlera plutôt de variable aléatoire réelle. Lorsqu’on en aura besoin, on désignera par FX la fonction de répartition de la variable aléatoire réelle X.

Paul Alphonse

2

ENS Rennes

2015

Mémoire M2 : Leçon 261

2016

1 . Fonction caractéristique et transformée de Laplace. 1.1 - Transformée de Fourier d’une mesure bornée - Fonction caractéristique. Définition 1.1.1 (Transformée de Fourier d’une mesure bornée). Soit µ une mesure bornée sur Rd muni de sa mesure borélienne. On appelle transformée de Fourier de µ b de Rd dans C définie par l’application µ

∀t ∈ Rd : µb(t) =

Z Rd

eih x,ti µ (dx).

Remarques La transformée de Fourier d’une mesure bornée est bien définie étant donné que

∀ t ∈ Rd :

Z Rd

|eihx,ti |µ (dx) ≤ µ (Rd ) < +∞.

De plus, si la mesure bornée µ admet une densité f par rapport à la mesure de Lebesgue sur Rd , alors Z f ( x) eih x,ti dx ∀t ∈ Rd : µb(t) = Rd

b est, à constante multiplicative près, la transformée de Fourier de la fonction f . et donc µ On définit alors la fonction caractéristique d’une variable aléatoire à partir de la transformée de Fourier de sa loi. Définition 1.1.2 (Fonction caractéristique). La fonction caractéristique d’une variable aléatoire X est la transformée de Fourier de sa loi PX . On la note ϕX . Remarques La transformée de Fourier d’une mesure bornée est bien définie étant donné que

∀ t ∈ Rd :

Z Rd

|eihx,ti |µ (dx) ≤ µ (Rd ) < +∞.

La loi d’une variable aléatoire étant par construction une mesure de probabilité, ϕ X existe pour toute variable aléatoire X. De plus, d’après le théorème de transfert :   ∀t ∈ Rd : ϕ X (t) = E eiht,X i . Exemples Soit X suivant une loi géométrique G( p) avec p ∈]0, 1[. Calculons sa fonction caractéristique. ∞

∀t ∈ R : ϕ X (t) =

∑ p(1 − p)k−1 eikt

=

(1 − p)eit p . 1 − p 1 − (1 − p)eit

=

k=1

=

p 1−p







(1 − p)eit

k

k=1

peit 1 − (1 − p)eit

Soit à présent X une variable aléatoire suivant une loi exponentielle E (λ ) avec λ ∈ R∗+ .

∀t ∈ R : ϕ X (t) =

Z ∞ 0

eitx λ e−λx dx

"

=

Paul Alphonse

e(it−λ ) x λ it − λ

3

= λ

0

# x=∞

= x=0

Z ∞

e(it−λ ) x dx

λ λ − it

ENS Rennes

2015

Mémoire M2 : Leçon 261

2016

Les deux tableaux suivants rassemblent les fonctions caractéristiques des lois usuelles (la lettre q désignera toujours 1 − p) : Lois

Paramètres

Fonctions caractéristiques

b( p)

p ∈]0, 1[

q + peit

B(n, p)

n ∈ N∗ : p ∈]0, 1[

(q + peit )n

P (λ )

λ ∈ R∗+

eλ (e

G( p)

p ∈]0, 1[

peit 1 − qeit

U {1, . . . , n}

n ∈ N∗

E (λ )

λ ∈ R∗+

Γ(n, λ )

n ∈ N∗ : λ ∈ R∗+

N (m, Σ)

m∈

Rd

it −1 )

ein 1 − eint n 1 − eit λ λ − it n  λ λ − it 

1 exp i hm, ti − t∗ Σt 2

: Σ ∈ S(d, R)

C( a)

a ∈ R∗+

e− a|t|

U [ a, b]

[ a, b] ⊂ R

eitb − eita it(b − a)



Proposition 1.1.1. La fonction caractéristique d’une variable aléatoire X vérifie : 1. ∀t ∈ Rd : |ϕ X (t)| ≤ ϕ X (0) = 1. 2. ∀t ∈ Rd : ϕ X (−t) = ϕ X (t). 3. Si la loi de X est symétrique, alors ϕ X est à valeurs réelles. 4. ∀ A ∈ L(Rd , Rk ), ∀b ∈ Rk : ϕ AX +b : t 7→ eihb,tiϕ X ( A∗ t). 5. ϕ X est uniformément continue sur Rd . Tout comme pour les fonctions intégrables, on a un théorème d’inversion de Fourier pour les mesures bornées. Proposition 1.1.2. Soit µ une mesure bornée sur Rd telle que sa transformée de Fourier soit Lebesgue-intégrable. Alors µ est absolument continue par rapport à la mesure de Lebesgue et sa densité est donnée λ-presque partout par la fonction continue h définie par

∀ x ∈ Rd : h ( x ) =

1 (2π )d

Z Rd

b(t) e−hx,ti dt. µ

Remarques Il résulte de la proposition précédente qu’une variable aléatoire dont la fonction caractéristique est intégrable est une variable aléatoire à densité. Il est possible de distinguer les fonctions caractéristiques parmi toutes les fonctions de R à valeurs complexes. Toute fonction caractéristique est continue, vaut 1 en 0 et est de type positif. Vérifions

Paul Alphonse

4

ENS Rennes

2015

Mémoire M2 : Leçon 261

2016

le dernier point : si µ est une mesure de probabilité sur R, alors pour tous n entier naturel, t1 , . . . , tn nombres réels et a1 , . . . , an nombres complexes : !  Z n n n n Z n n i (t j −tk ) x i (t j −tk ) x e µ (dx) a j ak = a j ak µ (dx) ∑ ∑ µb(t j − tk )a j ak = ∑ ∑ ∑ ∑e j=1 k=1

=

!

n

Z R

R

R

j=1 k=1

∑e

!

n

it j x

∑e

it j x

µ (dx)

j=1

j=1

= R Z

j=1 k=1 n

∑e

j=1

it j x

! 2 µ (dx)

≥ 0. Il est remarquable que les trois propriétés précédentes caractérisent les fonctions caractéristiques. Théorème 1.1.1 (Bochner-Herglotz). Une fonction ϕ : R → C est une fonction caractéristique si et seulement si elle est continue, est de type positif et vérifie ϕ(0) = 1.

1.2 - Transformée de Laplace d’une variable aléatoire. Définition 1.2.1 (Transformée de Laplace). Soit X une variable aléatoire. On définit DX = {t ∈ Rd : E(eht,X i ) < +∞} et GX :

DX t



R

7→ E(eht,X i )

.

GX est appelée la transformée de Laplace associée à X. Remarque GX est toujours définie en 0 mais GX ne peut être définie que sur ce seul singleton comme on va le voir dans les exemples qui suivent. Exemples Le calcul des transformées de Laplace de variables aléatoires est de même nature que le calcul de leur fonction caractéristique. Les lois présentes dans le tableau suivant montrent que l’intervalle de définition d’une transformée de Laplace n’est dans le cas général ni ouvert, ni fermé.

f : x 7→

Loi

Transformée de Laplace

Intervalle de définition

b( p)

q + pet

R

E (λ )

λ λ−t

] − ∞, λ [

1 1 ( x) (1 + x)2 [0,+∞[

Z ∞ 0

etx dx (1 + x)2

C(1)

0

] − ∞, 0] {0}

Proposition 1.2.1. Soit X une variable aléatoire réelle. Alors : 1. GX (0) = 1. 2. DX est un intervalle de R. 3. Si X est bornée, alors GX est définie et continue sur R. 4. Si X est positive, alors GX est continue sur R− . 5. Pour a et b deux réels, GaX +b : t 7→ ebt GX ( at). Paul Alphonse

5

ENS Rennes

2015

Mémoire M2 : Leçon 261

2016

1.3 - Caractérisation de la loi. Le théorème suivant justifie le nom de fonction caractéristique que l’on donne à la transformée de Fourier de la loi d’une variable aléatoire. Théorème 1.3.1. La transformée de Laplace caractérise la loi d’une variable aléatoire, ie si X et Y sont deux variables aléatoires telles que ϕ X = ϕY , alors PX = PY . Il en est de même pour la fonction caractéristique. Remarque Il est bien connu que la transformation de Fourier pour les fonctions intégrables est injective, en ce sens que deux fonctions intégrables de même transformée de Fourier sont égales presque partout. Le théorème précédent est le résultat analogue pour les mesures de probabilité (il reste vrai pour les mesures bornées). On utlisera ce théorème pour démontrer le théorème de Bernstein donnant une caractérisation des variables aléatoires gaussiennes.

2 . Liens avec l’indépendance. Aussi bien la transformée de Laplace que la fonction caractéristique se comportent de façon remarquable vis a vis de l’indépendance des variables aléatoires dont elles caractérisent la loi. C’est l’objet d’étude de cette nouvelle section.

2.1 - Caractérisations d’indépendance. La proposition principale de cette partie, à savoir la proposition la proposition 2.1.2, repose essentiellement sur la proposition suivante, qui résulte d’une part du théorème de Fubini, et d’autre part des théorèmes de transfert et de Fubini. Proposition 2.1.1. Soient µ et ν deux mesures bornées sur Rd . Alors :

\ b ν, µ ⊗ ν = µ.b b ν. µ[ ? ν = µ.b Proposition 2.1.2. Soient X et Y deux variables aléatoires réelles. Alors 1. X et Y sont indépendantes si et seulement si ϕ(X,Y ) = ϕ X ⊗ ϕY . 2. Si X et Y sont indépendantes, alors ϕ X +Y = ϕ X .ϕY . Démonstration. 1. X et Y sont indépendantes si et seulement si P(X,Y ) = PX ⊗ PY , soit si et seulement si \ \ P ( X,Y ) = PX ⊗ PY d’après le théorème 1.3.1. La proposition précédente donne alors le résultat. 2. Si X et Y sont indépendantes, la loi de X + Y est PX ? PY . Ici encore la proposition précédente donne le résultat.

Remarque et contre-exemple La proposition précédente est également valable pour la transformée de Laplace. De plus, la réciproque du deuxième point dans la proposition précédente est fausse. En effet, soit X une variable aléatoire réelle qui suit une loi de Cauchy C(1). Sa fonction caractéristique est comme on l’a déjà mentionné ∀t ∈ R : ϕ X (t) = e−|t| . Paul Alphonse

6

ENS Rennes

2015

Mémoire M2 : Leçon 261

2016

Le couple ( X, Y ), avec Y = X vérifie  2 ∀t ∈ R : ϕ X +Y (t) = ϕ2X (t) = e−2|t| = e−|t| = ϕ X (t)ϕY (t), mais X et Y ne sont pas indépendantes. Exemple d’application Soient ( Xi ) une suite de variables aléatoires réelles indépendantes et ( Sn ) la suite de ses sommes partielles. On a vu précédemment que la fonction caractéristique d’une variable aléatoire caractérise sa loi. La proposition précédente permet alors d’obtenir la loi des variables aléatoires Sn pour tout entier naturel non nul n. En effet, supposons par exemple que chaque Xi suit une loi de Bernoulli b( p) avec p ∈]0, 1[. Alors les Xi étant indépendantes, la proposition précédente donne : n

∀t ∈ R : ϕ Sn (t) = ϕ X1 +...+Xn (t) =

n

∏ ϕXi (t) =

i =1

∏ (q + peit ) = (q + peit )n .

i =1

Comme la fonction caractéristique caractérise la loi, on en déduit que Sn suit une loi B(n, p). Le tableau suivant rassemble d’autres résultats de cette nature : Loi de Xi

Paramètres

Loi de Sn

b( p)

p ∈]0, 1[

B(n, p)

P (λ )

λ ∈ R∗+

P (nλ )

B(ni , p)

ni ∈

N∗

!

n

: p ∈]0, 1[

B

∑ ni , p

i =1

E (λ )

λ ∈ R∗+

Γ(n, λ )

C( a)

a ∈ R∗+

C(na)

N (mi , σi2 )

mi ∈ R

: σi2

n

∈ R+

N

n

∑ mi , ∑

i =1

! σi2

i =1

2.2 - Inégalité de Hoeffding La transformée de Laplace permet de démontrer une inégalité de type grandes déviations : l’inégalité de Hoeffding. Lemme 2.2.1. Soit X une variable aléatoire réelle centrée bornée par 1. Alors 

∀t ∈ R : GX (t) ≤ exp

t2 2

 .

Démonstration. Soient t un nombre réel et x ∈ [−1, 1]. Par convexité de l’exponentielle, il vient   1−x 1+x 1 − x −t 1 + x t exp(tx) = exp (−t) + t ≤ e + e = cosh(t) + x sinh(t). 2 2 2 2 2

De plus, en comparant les développements en série entière respectifs, cosh(t) ≤ exp( t2 ) donc on obtient  2 t tx e ≤ exp + x sinh(t). 2 Etant donné que X est à valeurs dans [−1, 1], on peut appliquer l’inégalité précédente à X. Passant à l’espérance, on obtient l’inégalité voulu étant donné que X est centrée. Paul Alphonse

7

ENS Rennes

2015

Mémoire M2 : Leçon 261

2016

Théorème 2.2.1 (Inégalité de Hoeffding). Soit ( Xn ) une suite de variables aléatoires réelles indépendantes bornées presque sûrement et centrées. On suppose que | Xn | ≤ cn presque sûrement avec cn > 0. En posant Sn = X1 + . . . + Xn , il vient :   ε ∀ε > 0 : P (| Sn | > ε) ≤ 2 exp − . 2 ∑in=1 ci Démonstration. Soit t un réel strictement positif. Commençons par remarquer que

P (| Sn | > ε) = P ( Sn > ε) + P (− Sn > ε) . D’après l’inégalité de Markov et en utilisant l’indépendance des Xi , on obtient     n n P ( Sn > ε) ≤ e−tε E etSn = e−tε ∏ E etXi = e−tε ∏ GXi (t). i =1

 D’après le lemme précédent, GXi (t) ≤ exp

t2 ci2

i =1

 donc il vient

2

  t2σn P ( Sn > ε) ≤ exp −tε + . 2 Cette inégalité est vraie pour tout t > 0, on minimise donc l’argument de l’exponentielle précédente, ce qui donne   ε2 . P ( Sn > ε) ≤ exp − 2σn Comme les variables aléatoires − Xn vérifient les hypothèses de domination des Xn , on peut appliquer le raisonnement précédent aux − Xn , ce qui donne le résultat. L’inégalité de Hoeffding peut être employée pour démontrer des résultats de convergence comme l’illustre le corollaire suivant. Corollaire 2.2.1. Soit α > 0. On se place dans le cadre du théorème précédent en supposant de plus que n

∀n ∈ N :

∑ c2j ≤ n2α−β ,

j=1

avec β > 0. Alors la suite de terme général

n−α S

n

converge presque sûrement vers 0.

Démonstration. Considérons ε > 0. D’après l’inégalité de Hoeffding, on obtient avec l’hypothèse sur σn :     n2αε2 α P (| Sn | > n ε) ≤ 2 exp − ≤ 2 exp −ε2 nβ . 2σn Ainsi, la série de terme général P (| Sn | > nαε) converge car à partir d’un certain rang, ε2 nβ ≥ 2 ln n et par le lemme de Borel-Cantelli :   P lim sup (| Sn | > nαε) = 0. n→+∞

Or

Q∗+

est dénombrable donc il en résulte que  [

P

ε∈Q∗+



lim sup (| Sn | > nαε) = 0, n→+∞

et en passant au complémentaire : 

P

 \

ε∈Q∗+

lim inf (| Sn | ≤ nαε) = 1. n→+∞

Ceci montre, par définition de la limite inférieure, que la suite (n−α Sn ) converge presque sûrement vers 0. Paul Alphonse

8

ENS Rennes

2015

Mémoire M2 : Leçon 261

2016

2.3 - Théorème de Bernstein Dans ce paragraphe, on démontre une propriété caractéristique des variables aléatoires gaussiennes. Lemme 2.3.1. Soit φ : R → C une fonction borélienne telle que 1. φ est de module 1, 2. Pour tous s, t nombres réels, φ(s + t) = φ(s)φ(t). Alors il existe un nombre réel c tel que

∀t ∈ R : φ(t) = eict . Démonstration. Considérons la fonction

R → f :

x

C Z x

7→

0

φ(t) dt

.

Si f était identiquement nulle, alors les fonctions 0 tel que f (u) = au2 pour tout u réel (comme usuellement, on le montre sur N, puis sur Z, Q et enfin R par densité). Comme δb = |γb|2 , on a montré que   at2 ∀t ∈ R : |γb(t)| = exp − . 2 Pour terminer, considérons la fonction

R → g:

t

7→

C γb(t) , |γb(t)|

qui est bien définie d’après le point précédent. D’après tout ce qui précède, g vérifie

∀u, v ∈ R : g2 (u + v) = g2 (u) g2 (v). Or g2 est borélienne de module 1 donc d’après le lemme préliminaire, il existe un réel m tel que

∀t ∈ R : g2 (t) = e2imt . Comme g(0) = 1, g(t) = eimt pour tout t réel ce qui entraîne :   t2 ∀t ∈ R : γb(t) = exp imt − a . 2 Ainsi X + Y est une variable aléatoire gaussienne. De la même façon, X − Y est gaussienne et comme X + Y et X − Y sont indépendantes, cela entraîne que X = (( X + Y ) + ( X − Y )) /2 et Y = (( X + Y ) − ( X − Y )) /2 sont deux variables aléatoires gaussiennes. Paul Alphonse

10

ENS Rennes

2015

Mémoire M2 : Leçon 261

2016

2.4 - Opérations sur les transformées de Laplace et les transformées de Fourier. Le cas des fonctions caractéristiques. Théorème 2.4.1. Le produit de deux fonctions caractéristiques est une fonction caractéristique. Démonstration. Découle directement du deuxième point de la proposition la proposition 2.1.2. Théorème 2.4.2. Si ϕ est une fonction caractéristique, il en est de même de ϕ, |ϕ|2 et Re ϕ. Démonstration. Soit X une variable aléatoire. Raisonnons en trois points : 1. On a déjà vu que ϕ−X = ϕ X . 2. Soit X 0 une variable aléatoire indépendante de X et de même loi de X. Alors la variable aléatoire Y = X − X 0 admet pour fonction caractéristique : ϕY = ϕ X −X 0 = ϕ X ϕ−X = ϕ X ϕ X = |ϕ X |2 . 3. Enfin, Re ϕ = 12 (ϕ X + ϕ X ) est également une fonction caractéristique comme combinaison convexe de fonctions caractéristiques.

Le cas des transformées de Laplace. Théorème 2.4.3. Le produit de deux transformées de Laplace est une transformée de Laplace. Démonstration. Découle ici encore immédiatement de la proposition la proposition 2.1.2. Théorème 2.4.4. Si G est une transformée de Laplace, il en est de même de la fonction t 7→ G (t) G (−t). Démonstration. Elle est analogue à ce qui a été fait pour le théorème 2.4.2.

3 . Liens avec les moments. La régularité de la fonction caractéristique et de la transformée de Laplace est intimement liée à l’existence de moments pour les variables aléatoires. Néanmoins, les comportements de ces deux fonctions sont relativement différents. Théorème 3.0.1. Soit X une variable aléatoire réelle. 1. Si X admet un moment d’ordre n, alors ϕ X est de classe C n et   (k) ∀k ∈ J1, nK, ∀t ∈ R : ϕ X (t) = E ik X k eitX . 2. Si ϕ X est k-fois dérivable en 0, avec k ≥ 2, alors x admet des moments jusqu’à l’ordre 2 sont données par  { s k (l ) ∀l ∈ 1, 2 : ϕ X ( 0 ) = i l E( X l ) . 2

Paul Alphonse

11

j k k 2

et ils

ENS Rennes

2015

Mémoire M2 : Leçon 261

2016

Contre-exemple Comme le montre l’exemple ci-dessous, la fonction caractéristique peut être dérivable à l’origine sans que la variable aléatoire admette une moyenne. Soit X une variable aléatoire de loi PX = ∑k∈Z ak δk avec a0 = a1 = a−1 = 0 et

∀ k ≥ 2 : ak = a−k = où ∞

1 c= 2 Remarquons que c existe bien car ∑ définie. De plus :

1 k2 ln k



k=2

1 2 k ln k

k2

!−1 .

est une série de Bertrand convergente, X est donc bien ∞

E (| X |) = 2

c , ln k

∑∗ kak = 2 ∑

k ∈N

k=2

c =∞ k ln k

en tant que somme de Bertrand divergente donc X n’est pas intégrable. Montrons cependant que ϕ X est dérivable partout. Comme la loi de X est symétrique, ϕ X est une fonction à valeurs réelles : ∞

∀t ∈ R : ϕ X (t) = a0 + 2

∑ ak cos(kt).

k=1

Remarquons que la suite ( ak ) a été choisie de telle sorte que la suite (kak ) tende en décroissant vers 0. De plus : n n 1 − ei (n+1) x 2 ikx ∗  , ∀n ∈ N : ∑ sin(kx) ≤ ∑ e = ≤ ix k=0 k=0 1−e | sin 2x | donc pour tout α ∈]0, 2π [ : n 2  . ∀n ∈ N , ∀ x ∈ [α, 2π − α ] : ∑ sin(kx) ≤ k=0 | sin α2 | ∗

Le critère d’Abel assure donc la convergence uniforme de la série de fonctions ∑ kak sin(kt) sur tout intervalle de la forme [α, 2π − α ]. La fonction ϕ X est donc dérivable sur ces intervalles et aussi sur R \ 2π Z car elle est 2π-périodique. Il ne reste plus qu’à démontrer que ϕ X est dérivable en 0. Pour tout t non nul, l’expression de ϕ X donne : 0≤

1 − ϕ X (t) 1 2c = E (1 − cos (tX )) = t t t





k=2

1 − cos(kt) . k2 ln k

Pour tout t tel que 0 < t < 1/2, éclatons cette somme en deux suivant que k est plus petit ou plus grand que t−1 . Les fonctions x 7→ (ln x)−1 et x 7→ x−2 sont décroissantes sur R∗+ donc 0≤

1 t



k≥ 1t

1 − cos(kt) k2 ln k



= Ainsi :

1 t



k≥ 1t

−2 t ln t



k≥b 1t c

1 k2

−2 ∞ 1 dx t ln t b 1t c−1 x2 j k 1 t +1 1 ≤ −2 j k . 1 − 1 ln t ≤

−2 j k  1 t t − 1 ln t

Z

t

1 − cos(kt) −→ 0. t→0 k2 ln k

En utilisant l’inégalité

∀ x ∈ R : 1 − cos x ≤ Paul Alphonse

12

x2 , 2 ENS Rennes

2015

Mémoire M2 : Leçon 261

2016

on obtient de même : 0



1 t



2≤k< 1t

1 − cos(kt) k2 ln k

≤ t



2≤k< 1t



1 ln k

t +t ln 2

≤ Z k



3≤k< 1t

1 dx ln x

k−1



t +t ln 2 t +t ln 2



3≤k< 1t 1 t

Z 2

1 ln k

1 dx. ln x

De plus, par intégration par parties :

∀ y ∈ [2, +∞[: Mais puisque,

1 = (ln x)2 x→+∞

o



1 ln x

Z y



2

1 y 2 dx = − + ln x ln y ln 2

Z y

1

2

(ln x)2

dx.

, on a

Z y

1

2

(ln x)2

Il en résulte que 1 y

dx

Z y 2

=

y→+∞

1 dx ln x

o

y

Z



2

y→+∞

 1 dx . ln x

1 , ln y

puis t

1 t

Z 2

1 dx −→ 0, ln x t→0

ce qui achève de démontrer que 1 − ϕ X (t) −→ 0, t t→0 ie que ϕ X est dérivable en 0 de dérivée nulle. Théorème 3.0.2. ˚ X contient 0. Alors pour tout entier non nul k, X admet un Soit X une variable aléatoire réelle telle que D moment d’ordre k et sur un voisinage de 0 : +∞

GX ( t ) =

E( X k ) k t . k! k=0



(k)

en particulier, pour tout k entier naturel non nul, GX (0) = E( X k ). Exemple Soit X une variable aléatoire suivant une loi N (0, 1). Alors :

∀ t ∈ R : GX ( t ) = e − t

2 /2

+∞

=



k=0

t2k . 2k k!

En particulier, pour tout entier naturel k :

E( X 2k ) =

(2k)! , 2k k!

E( X 2k+1 ) = 0.

4 . Liens avec la convergence en loi. Cette section est consacrée à l’étude de la convergence en loi et du rôle que la fonction caractéristique et la transformée de Laplace jouent dans cette convergence.

Paul Alphonse

13

ENS Rennes

2015

Mémoire M2 : Leçon 261

2016

4.1 - Notion de convergence en loi. Définition 4.1.1 (Convergence en loi). Soient ( Xn ) une suite de variables aléatoires et X une variable aléatoire. On dit que ( Xn ) converge en loi vers X si pour toute fonction continue bornée f : Rd → Rd :

E( f ( Xn ))



n→+∞

E( f ( X )).

L

On note Xn −→ X n→+∞

Exemple

(δ1/n ) converge en loi vers δ0 . En effet, si h est une fonction continue bornée de R dans R, alors   Z Z 1 h δ1/n = h → h(0) = h δ0 . n n→+∞ R R Théorème 4.1.1. Soient ( Xn ) une suite de variables aléatoires réelles de X une variable aléatoire réelle. La suite ( Xn ) converge en loi vers X si et seulement si en tout point x de continuité de FX , on a FXn ( x) → FX ( x). n→+∞

Remarque La notion de convergence en loi concerne les lois des variables aléatoires et non pas les variables aléatoire elles-mêmes. Exemple Si (σn ) est une suite réelle qui converge vers 0, alors (N (0, σn2 )) converge en loi vers δ0 . En effet, pour tout x réel et tout entier naturel non nul n :  0 si x < 0     Z x  1 t2 1 FXn ( x) = √ exp − 2 dt → F ∗ ( x) = si x = 0 . n→+∞  2σn σn 2π −∞   2 1 si x > 0 La fonction F ∗ n’est pas la fonction de répartition d’une loi de probabilité car n’est pas continue à droite en l’origine. Toutefois, en désignant par F la fonction de répartition de la variable aléatoire nulle, F ∗ coïncide avec F sauf en 0, point de discontinuité de F. D’où la convergence annoncée. Théorème 4.1.2 (Lévy). 1. Soit ( Xn ) une suite de variables aléatoires qui converge en loi vers une variable aléatoire X. Alors la suite (ϕ Xn ) converge simplement sur R vers ϕ X . 2. Soit ( Xn ) une suite de variables aléatoires telle que (ϕ Xn ) converge simplement sur R vers une fonction ϕ continue en 0. Alors ϕ est la fonction caractéristique d’une variable aléatoire X et ( Xn ) converge en loi vers X. Contre-exemple La convergence simple de la suite des fonctions caractéristiques ne suffit pas pour déduire la convergence en loi de ( Xn ). En effet, considérons la suite de variables aléatoires ( Xn ) avec Xn suivant la loi N (0, n). Alors ( 0 si t 6= 0 lim ϕ Xn (t) = , n→+∞ 1 si t = 0 donc (ϕ Xn ) converge simplement vers une fonction non continue en 0. Montrons que la suite ( Xn ) ne converge pas en loi. On a 1 ∀ x ∈ R : FXn ( x) = √ n 2π Paul Alphonse

Z x −∞

e−u

2 /(2n2 )

14

1 du = √ 2π

Z x/n −∞

e−u

2 /2

du



n→+∞

1 . 2 ENS Rennes

2015

Mémoire M2 : Leçon 261

2016

La suite ( FXn ) ne peut converger vers une fonction de répartition F en dehors des points de discontinuité de celle-ci, car ces points forment un ensemble dénombrable D et F ne peut être constante à 21 en dehors de D, puisque F doit tendre vers 1 en +∞. Théorème 4.1.3. Soient X et ( Xn ), respectivement une variable aléatoire réelle et une suite de variables aléatoires réelles, admettant des transformées de Laplace sur un intervalle ouvert I contenant 0. Alors L

∀t ∈ I : GXn (t) −→ GX (t) ⇐⇒ Xn −→ X. n→+∞

n→+∞

4.2 - Le théorème central limite. Le théorème central limite est un théorème fondamental aussi bien en probabilité qu’en statistique. On lui consacre la sous-section qui suit. Théorème 4.2.1 (Théorème central Limite). Soit ( Xn ) une suite de variables aléatoires réelles indépendantes et identiquement distribuées de carrés intégrables. Pour tout entier naturel n, on pose Sn = X1 + . . . + Xn . Soient également m = E( X1 ) et σ 2 = Var( X1 ). Alors Sn − nm L √ −→ N (0, 1). nσ 2 n→+∞ Pour démontrer ce théorème, on a besoin des deux lemmes suivants. Lemme 4.2.1. Soient ( an ) et (bn ) deux suites de nombres complexes de module inférieur à 1. Alors n n n ∗ ∀ n ∈ N : ∏ ai − ∏ bi ≤ ∑ | ai − bi | . i =1 i =1 i =1 Démonstration. Soit n en entier naturel non nul. Alors n+1 n+1 n n+1 n+1 n ∏ ai − ∏ bi ≤ ∏ ai − a n+1 ∏ bi + a n+1 ∏ bi − ∏ bi i =1 i =1 i =1 i =1 i =1 i =1 n n n = | a n+1 | ∏ ai − ∏ bi + ∏ bi | a n+1 − b n+1 | i =1 i =1 i =1 n n ≤ ∏ ai − ∏ bi + | a n+1 − b n+1 | , i =1 i =1 et le résultat s’ensuit par récurrence. Lemme 4.2.2. Soit X une variable aléatoire réelle de carré intégrable. Alors     t2 |t| 3 2 2 2 ∀t ∈ R : ϕ X (t) − 1 + itE( X ) − E( X ) ≤ t E X ∧ | X | . 2 6 Démonstration. Soit x ∈ R. La formule de Taylor avec reste intégral appliquée à l’ordre 2 donne eix = 1 + ix − x2 Comme

R1 0

Z 1 0

(1 − u)eiux du.

(1 − u)du = 12 , il vient eix − (1 + ix −

Paul Alphonse

x2 ) = − x2 2 15

Z 1 0

(1 − u)(eiux − 1)du ENS Rennes

2015

Mémoire M2 : Leçon 261

2016

puis  2  ix e − 1 + ix − x ≤ x2 . 2 De plus, d’après l’inégalité de Taylor-Lagrange,  2  3 ix e − 1 + ix − x ≤ | x | , 2 6 donc on en déduit l’inégalité suivante :  2  3 ix e − 1 + ix − x ≤ x2 ∧ | x | . 2 6 Le résultat s’obtient alors en appliquant cette inégalité à tX, pour t un nombre réel, et en utilisant l’inégalité de Jensen en passant à l’espérance. On peut à présent s’attaquer à la démonstration du théorème central limite. Démonstration du théorème central limite. √ Quitte à centrer et à réduire, on peut supposer que m est nulle et σ vaut 1. Posons Yn = Sn / n. Soit t un nombre réel. Commençons par remarquer que   n t ∀n ∈ N∗ : ϕYn (t) = ϕ X1 √ . n 2

t | ≤ 1. Alors d’après les deux lemmes précédents : Choisissons n assez grand pour que |1 − 2n     n    t t n t2 t2 − 1− − 1− ϕ X1 √ ≤ n ϕ X1 √ 2n 2n n n



  nt |t| E X2 ∧ √ |X3 | n 6 n



n→+∞

0

d’après le théorème de convergence dominée, dont les hypothèses sont immédiatement vérifiées. De plus,   2 n t2 t 1− → exp − , n→+∞ 2n 2 donc

t2 ϕYn (t) → exp − n→+∞ 2 



et le théorème de Lévy donne le résultat escompté. Le théorème central limite admet une réciproque donné par le théorème suivant : Théorème 4.2.2. Soit ( Xn ) une suite de variables aléatoires réelles indépendantes et identiquement distribuées telle que X1 ∈ L1 (Ω) et E( X1 ) = 0 vérifiant de plus S L √n −→ N (0, 1), n →+ ∞ n avec Sn = ∑in=1 Xi . Alors X1 est de carré intégrable et E( X12 ) = 1. Pour démontrer ce résultat, on a de nouveau besoin de deux lemmes. Lemme 4.2.3. Soit X une variable aléatoire réelle. Alors dans [0, +∞] :   Z 1 − Re ϕ X (u) = x2 PX (dx). lim 2 u→0 u2 R2 Paul Alphonse

16

ENS Rennes

2015

Mémoire M2 : Leçon 261

2016

Démonstration. Pour u un réel non nul, on a I (u) = 2

1 − Re ϕ X (u) =2 u2

Z R

1 − cos(ux) PX (dx). u2

Le terme 1 − cos(ux)/u2 est compris entre 0 et x2 /2 d’après l’inégalité de Taylor-Lagrange et converge vers x2 /2 lorsque u tend vers 0 d’après l’inégalité de Taylor-Young. Le lemme de Fatou donne alors : Z Z x2 dPX (dx) ≤ lim inf I (u) ≤ lim sup I (u) ≤ x2 PX (dx). u→0

R

u→0

R

D’où le résultat. Lemme 4.2.4. Soit ( X, Y ) un couple de variables aléatoires réelles indépendantes telle que X + Y appartient à L2 (Ω). Alors X et Y appartiennent à L2 (Ω). Démonstration. Montrons que Y est de carré intégrable. On a

E(( X + Y )2 ) =

Z

E(( x + Y )2 )PX (dx), R

donc pour PX presque tout x réel, la somme x + Y appartient à L2 (Ω). On peut à présent démontrer la réciproque du théorème central limite. Démonstration du théorème 4.2.2. Soit ϕ la fonction caractéristique de X1 . Supposons dans un premier temps que la loi de X1 est symétrique, ce qui implique que ϕ est à valeurs réelles. Par hypothèse et d’après le théorème de Lévy,   n 1 = e−1/2 . lim ϕ √ n→+∞ n √ Or, pour n assez grand, ϕ(1/ n) > √ 0 car ϕ(0) = 1 et ϕ est continue, on peut donc passer au √ logarithme, ce qui entraîne n ln ϕ(1/ n) ∼ −1/2, d’où ϕ(1/ n) − 1 ∼ −1/(2n). D’après le lemme 4.2.3, on en déduit √ ! Z 1 − ϕ 1 / n 2 x2 PX1 (dx) = lim = 1. E( X12 ) = n →+ ∞ 1 / n R Passons maintenant au cas général. L’hypothèse entraîne que la suite ( Zn ) définie par

( X1 − X2 ) + ( X3 − X4 ) + . . . + ( X2n−1 − X2n ) √ 2n   1 X1 + X3 + . . . + X2n−1 X2 + X4 + . . . + X2n √ √ = √ − n n 2

Zn =

converge part, si on pose Yn = ( X2n−1 − √ en loi vers une variable aléatoire de loi N (0, 1). D’autre√ X2n ))/ 2, on peut écrire Zn sous la forme Zn = (Y1 + . . . + Yn )/ n où les Yn sont des variables aléatoires indépendantes, de même loi symétrique et centrées. On peut donc leur appliquer le cas précédent, ce qui entraine que E(Y12 ) = 1 et le lemme 4.2.4 permet d’en déduire que E( X12 ) = 1.

Paul Alphonse

17

ENS Rennes

2015

Mémoire M2 : Leçon 261

2016

4.3 - Exemples d’utilisation du théorème central limite Intervalles de confiance Le théorème central limite permet en statistique de déterminer des intervalles de confiance asymptotique. Par exemple, considérons X1 , . . . , Xn des variables aléatoires réelles indépendantes et identiquement distribuées, de moyenne m ∈ R et de variance σ 2 ∈ R+ . On suppose que l’on cherche la moyenne et que l’on ne connait pas la variance. En notant X n la moyenne empirique des variables aléatoires Xi , il vient d’après le théorème central limite r  L n X n − m −→ N (0, 1). 2 n→+∞ σ Si S2n désigne la variance empirique des Xi , ( Sn ) converge presque surement vers σ donc d’après le théorème de Slutsky :  √ n Xn − m L −→ N (0, 1). n→+∞ Sn Ainsi, si N est une variable aléatoire réelle de loi N (0, 1), il vient : √  n ∀ t ∈ R+ : P Xn − m > t −→ 2 P ( N > t) . n→+∞ Sn Finalement : 



Sn Sn ∀ t ∈ R+ : P m ∈ X n − t √ , X n + t √ n n et





−→ 1 − 2 P ( N < t)

n→+∞

Sn Sn X n − tα √ , X n + tα √ n n



est un intervalle de confiance asymptotique de probabilité de sureté 1 − α lorsque tα est le 1 − α /2 quantile de la loi N (0, 1). Calculs de limites Le théorème central limite permet de calculer des limites. Par exemple, montrons que e−n

n



k=0

nk k!



n→+∞

1 . 2

Soit ( Xn ) une suite de variables aléatoires indépendantes et identiquement distribuées suivant une loi de Poisson P (1). Alors comme on l’a déjà vu, la variable aléatoire Sn suit en conséquence une loi de Poisson P (n) pour tout entier √ naturel non nul n. Alors d’après le théorème central limite, la suite de terme général ( Sn − n)/ n converge en loi vers une variable aléatoire suivant une loi normale N (0, 1), que l’on note Y. Alors   Sn − n 1 √ P( S n ≤ n ) = P ≤0 → P (Y ≤ 0 ) = . n→+∞ 2 n Or

∀ n ∈ N∗ : P( S n ≤ n ) =

n



k=0

nk −n e , k!

donc le résultat s’ensuit. Formule de Stirling Le théorème central limite permet également de démontrer la formule de Stirling. On admet le lemme suivant qui nous sera utile par la suite :

Paul Alphonse

18

ENS Rennes

2015

Mémoire M2 : Leçon 261

2016

Lemme 4.3.1. Soit ( Xn ) une suite de variables aléatoires réelles qui converge en loi vers une variable aléatoire X. On suppose que supn∈N E( Xn2 ) < ∞. Alors E(| Xn |) → E(| X |). n→+∞

Les deux égalités suivantes, valables pour tous entiers naturels m et n, s’obtiennent facilement en intégrant par parties : Z ∞ m

yn e− y dy = n! e−m

n



k=0

Z m 0

yn e− y dy = n!

mk , k!

1 − e−m

n



k=0

mk k!

! .

Soit ( Xn ) une suite de variables aléatoires indépendantes et identiquement distribuées de loi exponentielle E (1)√ . On a montré dans un paragraphe précédent qu’alors Sn suit la loi Γ(n, 1). Posons Yn = ( Sn − n)/ n et considérons Y une variable aléatoire de loi normale N (0, 1). Alors d’après le théorème central limite, (Yn ) converge en loi vers Y et vérifie de plus :   Sn − n 1 ∗ √ ∀n ∈ N : Var = Var( Sn ) = 1, n n donc supn∈N∗ E(Yn2 ) < ∞. D’après le lemme 4.3.1, il s’ensuit : Z R

| y| PYn (dy)

Or Z

| y| PY (dy)

= 2

R

| y| PYn (dy) =

n→+∞

2 Z ∞ y e− y /2



0

R

Z





Z ∞ | y − n|



0

n

Z

| y| PY (dy). R

r

=

dy

yn−1 − y e dy (n − 1)!

2 , π 1

=

2nn− 2 e−n , (n − 1)!

donc on en déduit la formule de Stirling n!



n→+∞

 n n √ e

2πn.

Références [Can13]

Bernard Candelpergher. Théorie des probabilités, une introduction élémentaire. Calvage et Mounet, 2013.

[CGCDM05] Marie Cottrel, Valentine Genon-Catalot, Christian Duhamel, and Thierry Meyre. Exercices de probabilités. Cassini, 2005. [FF12]

Dominique Foata and Aimé Fuchs. Calcul des probabilités. Dunod, 2012.

[Let97]

Gérard Letac. Intégration et probabilités - Analyse de Fourier. Masson, 1997.

[Ouv00]

Jean-Yves Ouvrard. Probabilités 2. Cassini, 2000.

[Tou99]

Paul S. Toulouse. Thèmes de probabilité. Dunod, 1999.

Paul Alphonse

19

ENS Rennes

View more...

Comments

Copyright � 2017 NANOPDF Inc.
SUPPORT NANOPDF