L'objectif est de caractériser la position et la dispersion des caractères d'une série statistique.
- le salaire médian est de \( 2.183 \)€ net par an.
- le salaire moyen est de \( 2.735 \)€ net par an.
Comment interpréter cela ?
Dans tout ce qui suit, \( n\in{\mathbb N}^* \) et \( (x_1, ..., x_n) \), abrégée \( (x_i) \), désigne une liste croissante de nombres réels.
1. Médiane et quartile
1. Définition : on désigne par médiane, notée \( M \), toute valeur qui partage \( (x_i) \) en deux parties de même effectif.
- tous les éléments du premier groupe ont des valeurs inférieures à \( M \).
- tous les éléments du deuxième groupe ont des valeurs supérieures à \( M \).
La médiane est un paramètre de position.
La médiane n'est pas sensible aux valeurs extrêmes !
Attention !
- Si \( n \) est un nombre impair, la médiane est le terme de rang \( i = \frac{n+1}{2} \).
- Si \( n \) est un nombre pair, il y a plusieurs médianes possibles : toutes les valeurs comprises entre les termes de rang \( i = \frac{n}{2} \) et \( i + 1 \) conviennent !
- premier quartile, noté \( Q_1 \), la première valeur de \( (x_i) \) atteignant le quart de la série.
- troisième quartile, noté \( Q_3 \), la première valeur de \( (x_i) \) atteignant les trois-quart de la série.
On pourrait définir de la même manière le deuxième quartile : il s'agit approximativement de la médiane.
3. Définition : l'écart interquartile est \( Q_{3-1} = Q_3 - Q_1 \).
L'écart interquartile est un paramètre de dispersion : il regroupe la moitié de la série statistique positionnée autour de la médiane.
2. Moyenne et écart-type
1. Définition : la moyenne des \( (x_i) \) est \( \mu = \dfrac{x_1 + ... + x_n}{n} \)
La moyenne est un paramètre de position.
La moyenne est linéaire. Autrement dit, ajouter ou multiplier tous les \( (x_i) \) par un même coefficient aura le même effet sur \( \mu \).
2. Définition : l'écart-type des \( (x_i) \) est \( \sigma = \sqrt{\dfrac{(x_1 - \mu)^2 + ... + (x_n- \mu)^2}{n}} \)
L'écart-type est un paramètre de dispersion.
L'écart-type mesure la répartition que devrait avoir normalement la série autour de la moyenne selon la proportion suivante :
| Proportion | Intervalle |
| 68% | \( [\mu - \sigma; \mu + \sigma] \) |
| 95% | \( [\mu - 2\sigma; \mu + 2\sigma] \) |
| 99% | \( [\mu - 3\sigma; \mu + 3\sigma] \) |
