Statistiques à deux variables

Analyse de données
| Lundi 22 Septembre 2025

1. Notions élémentaires

1. Définition : une série statistique à deux variables consiste à étudier simultanément deux caractères sur un même échantillon de taille \( n\in {\mathbb N}^* \) d'une population.

En règle générale, cette situation est présentée dans un tableau.
Le premier caractère est noté \( X = (x_1; ...; x_n) \), le second \( Y = (y_1; ...; y_n) \).

Il faut impérativement savoir faire ce tableau à la calculatrice !

2. Notation : considérons une série statistique \( (X; Y) \).
- On note \( \overline{X} \) la moyenne des valeurs prises par \( X \).
- On note \( \overline{Y} \) la moyenne des valeurs prises par \( Y \).

Autrement dit,

\( \displaystyle \overline{X} = \dfrac{x_1 + ... + x_n}{n} = \dfrac{1}{n}\sum_{i=1}^n x_i \)

\( \displaystyle \overline{Y} = \dfrac{y_1 + ... + y_n}{n} = \dfrac{1}{n}\sum_{i=1}^n y_i \)

Ces calculs peuvent-être fait à la calculatrice !

3. Interprétation graphique : dans un repère orthogonal \( (O; \vec{i}; \vec{j}) \), l'ensemble des points \( P_i(x_i; y_i) \) est appelé nuage de points de la série statistique.
Le point \( M(\overline{X}; \overline{Y}) \) est appelé point moyen.

Il faut impérativement savoir faire ce nuage à la calculatrice !

2. Ajustement affine

Après avoir tracé le nuage de points d'une série statistique, on cherche la meilleure droite représentant la série :
- il faut qu'elle passe par le point moyen.
- il faut qu'elle minimise les écarts avec tous les points.

Plus précisément, on cherche l'équation de cette droite, c'est à dire une expression de la forme :

\( \displaystyle Y = aX + b \)

On l'obtient en utilisant la méthode des moindres carrés.

Il faut impérativement savoir trouver l'équation de cette droite à la calculatrice !

Théorème [admis]
Les coefficients de la droite sont :

\( \displaystyle a = \frac{\displaystyle\sum_{i=1}^n x_i y_i - n \overline{X}\overline{Y}}{\displaystyle\sum_{i=1}^n x_i^2 - n \overline{X}^2} \)

\( \displaystyle b = \overline{Y} - a \overline{X} \)