Dans tout ce qui suit, \( (X_n) \) désigne une suite de variables aléatoires réelles discrètes, indépendantes et identiquement distribuées, définies sur un espace probabilisé \( (\Omega, {\cal M}, P) \).
Supposons que la loi suivie par chaque \( X_n \) possède une espérance, et notons :
\( \displaystyle \mu = E(X_1) = {\small\dots} = E(X_n) \)
Dans la suite du document, nous allons nous intéresser à la moyenne empirique définie pour tout \( n\in{\mathbb N}^* \) par :
\( \displaystyle \overline{X_n} = \frac{1}{n}\sum_{i=1}^n X_i \)
Commençons par remarquer qu'évidemment :
Propriété : \( E\Big( \overline{X_n} \Big) = \mu \)
Démonstration : c'est immédiat au vu de la linéarité de l'espérance !
\( \displaystyle E\Big(\overline{X_n}\Big) = E\left(\frac{1}{n} \sum_{i=1}^n X_i\right) \)\( \displaystyle = \frac{1}{n} \sum_{i=1}^n E(X_i) \)\( \displaystyle = \frac{1}{n} \sum_{i=1}^n \mu = \mu \)
■
1. Loi faible des grands nombres
Supposons maintenant que chaque variable \( X_n \) admette la même variance, et donc le même écart-type noté \( \sigma \).
1. Propriété : \( V\Big( \overline{X_n} \Big) = \dfrac{\sigma^2}{n} \)
Démonstration : commençons par remarquer que :
\( \displaystyle V\Big( \overline{X_n} \Big) = V\Big( \frac{1}{n}\sum_{i=1}^n X_i \Big) = \frac{1}{n^2} V\Big( \sum_{i=1}^n X_i \Big) \)
Puisque les \( X_n \) sont indépendantes,
\( \displaystyle V\Big( \overline{X_n} \Big) = \frac{1}{n^2} \sum_{i=1}^n V( X_i) = \frac{1}{n^2} n\sigma^2 = \frac{\sigma^2}{n} \)
■
L'inégalité de Bienaymé-Tchebychev donne alors pour tout \( \lambda > 0 \)
\( \displaystyle P\Big( | \overline{X_n} - \mu | > \lambda \Big) \leqslant \frac{\sigma^2}{n\lambda^2} \)
Nous passons alors à la limite pour \( n\rightarrow+\infty \) :
2. Théorème [Loi faible des grands nombres] : pour tout \( \lambda> 0 \),
\( \displaystyle \lim_{n\rightarrow +\infty} P\Big(|\overline{X_n} - \mu| > \lambda\Big) = 0 \)
On dit que la suite \( (\overline{X_n}) \) converge vers \( \mu \) en probabilité.
2. Loi forte des grands nombres
On peut - en quelque sorte - inverser limite et probabilité : ainsi la suite \( (\overline{X_n}) \) converge vers \( \mu \) presque surement. Autrement dit :
Théorème [Loi forte des grands nombres]
\( \displaystyle P\Big(\lim_{n\rightarrow +\infty} \overline{X_n} = \mu\Big) = 1 \)
Démonstration : ce théorème est admis au programme de l'agrégation interne.
Ouf ! ■
Notons que la converge vers \( \mu \) presque surement implique une convergence en probabilité. Il n'y avait donc pas vraiment besoin de l'existence d'une variance commune dans le théorème précédent… mais la démonstration est bien plus ardue !
3. Théorème central de la limite
Supposons - de nouveau - que chaque variable \( X_n \) admette la même variance, et donc le même écart-type noté \( \sigma \).
1. Propriété : la variable \( \frac{\sqrt{n}}{\sigma} \big(\overline{X_n} - \mu\big) \) est centrée et réduite.
Démonstration : en effet :
\( \displaystyle E\left(\frac{\sqrt{n}}{\sigma} \left(\overline{X_n} - \mu\right)\right) = \frac{\sqrt{n}}{\sigma} \left(\underbrace{E(\overline{X_n})}_{\mu} - \mu\right) = 0 \)
\( \displaystyle V\left(\frac{\sqrt{n}}{\sigma} \left(\overline{X_n} - \mu\right)\right) = \frac{\sqrt{n}^2}{\sigma^2} V\left(\overline{X_n} - \mu\right) = \frac{n}{\sigma^2}\frac{\sigma^2}{n} = 1 \)
■
2. Théorème [central de la limite] - Pour tout \( x\in\mathbb{R} \),
\( \displaystyle \lim_{n\rightarrow +\infty} P\left[ \frac{\sqrt{n}}{\sigma}\, \big(\overline{X_n} - \mu\big) \leq x\right] = \underbrace{\frac{1}{\sqrt{2\pi}}\int_{\small-\infty}^x {e^{-t^2 / 2}dt}}_{\Phi(x)} \)
Démonstration : ce théorème est admis au programme de l'agrégation interne.
Ouf ! ■
Ce théorème est d'une utilité quasi systématique en probabilité.
D'où son appellation de théorème "central" !
Encadrement
Commençons par remarquer que pour tout \( x>0 \),
\( \displaystyle \frac{1}{\sqrt{2\pi}}\int_{-x}^x {e^{-t^2 / 2}dt} = \frac{1}{\sqrt{2\pi}}\int_{-\infty}^{x} {e^{-t^2 / 2}dt} + \frac{1}{\sqrt{2\pi}}\int_{-x}^{+\infty} {e^{-t^2 / 2}dt} -1 \)
Par symétrie,
\( \displaystyle \frac{1}{\sqrt{2\pi}}\int_{-x}^x {e^{-t^2 / 2}dt} = 2\frac{1}{\sqrt{2\pi}}\int_{-\infty}^{x} {e^{-t^2 / 2}dt}-1= 2\Phi(x)-1 \)
Ainsi, une relecture du théorème central de la limite nous donne :
\( \displaystyle \lim_{n\rightarrow +\infty} P\left[ -x \leqslant \frac{\sqrt{n}}{\sigma}\, \big(\overline{X_n} - \mu\big) \leqslant x\right] = 2\Phi(x)-1 \)
Adoptons l'écriture du théorème central de la limite sous sa forme d'intervalle.
Corollaire - pour tout \( x>0 \),
\( \displaystyle \lim_{n\rightarrow +\infty} P\left[ \mu - \frac{x\,\sigma}{\sqrt{n}} \leqslant \overline{X_n} \leqslant \mu+\frac{x\,\sigma}{\sqrt{n}}\right] = 2\Phi(x)-1 \)
Intervalles de fluctuation
Nous souhaitons déterminer \( x \) pour que la probabilité tende vers \( 95 \)%. Autrement dit, \( 2\Phi(x)-1= 0.95 \), c'est à dire :
\( \displaystyle \Phi(x) = \frac{0.95+1}{2} = 0.975 \)
La table de la loi normale nous donne \( x\approx 1.96 \). On estime donc que :
\( \displaystyle \lim_{n\rightarrow +\infty} P\left[ \mu-\frac{1.96\,\sigma}{\sqrt{n}} \leqslant \overline{X_n} \leqslant \mu+\frac{1.96\,\sigma}{\sqrt{n}}\right] = 0.95 \)
Cet intervalle est appelé intervalle de fluctuation à 95%.
En reprenant ce raisonnement pour différents seuils, nous obtenons le tableau récapitulatif suivant :
| Seuil (\( \small2\Phi(x) -1 \)) | 90 % | 95 % | 98 % | 99 % | 99,5 % | 99,9 % |
| Coefficient (\( \small x \)) | 1,64 | 1,96 | 2,33 | 2,58 | 2,81 | 3,29 |

