Statistique à double variable – Maths BTS
Retour aux cours
Statistiques

Statistique à double variable

Elle étudie la relation entre deux variables afin de comprendre comment elles varient ensemble.
On distingue souvent :
- Variable dépendante : ce qu’on cherche à expliquer.
- Variable indépendante : ce qui peut influencer la variable dépendante.

Statistiques à deux variables


I. Position du problème


Soit une série statistique double $(x_i, y_i)$ pour $n$ individus.
Le nuage de points est l'ensemble des points $M_i(x_i, y_i)$ dans un repère orthogonal.

Exemple : nombre d'adhérents d'un club de rugby (2001–2006)
\[
\begin{array}{c|cccccc}
x_i & 1 & 2 & 3 & 4 & 5 & 6 \\
\hline
y_i & 70 & 90 & 115 & 140 & 170 & 220
\end{array}
\]
Le point moyen $G(\bar x, \bar y)$ a pour coordonnées :
\[
\bar x = \frac{1}{n}\sum_{i=1}^n x_i, \qquad
\bar y = \frac{1}{n}\sum_{i=1}^n y_i.
\]
Pour l'exemple :
\(
G_1(2\,;\,91,7) \text{ (premiers trois points)},\) \(G_2(5\,;\,176,7) \text{ (trois derniers)},\) \(G(3,5\,;\,134,2).\)

II. Ajustements


1. Méthode de Mayer


Droite passant par deux points moyens du nuage.
Pour $G_1$ et $G_2$ :
\(a = \frac{176,7 - 91,7}{5-2} = 28,3,\) \(b = 91,7 - 28,3\times 2 = 35,1,\)
d'où $D_1 : y = 28,3x + 35,1$.

2. Méthode des moindres carrés


La droite de régression de $y$ en $x$ minimise $\sum [y_i - (ax_i + b)]^2$.
Son équation est $y = ax + b$ avec
\[
a = \frac{\sigma_{xy}}{\sigma_x^2},\qquad b = \bar y - a\bar x,
\]
où la covariance $\displaystyle \sigma_{xy} =$ $\frac{1}{n}\sum (x_i-\bar x)(y_i-\bar y)
$ $= \frac{1}{n}\sum x_i y_i - \bar x \bar y$.

Pour l'exemple (calculatrice) : $D_2 : y = 29x + 32,7$.

3. Ajustement exponentiel


On pose $z = \ln y$. Le tableau devient :
\[
\begin{array}{c|c}
x_i & z_i \\
\hline
1 & 4,248\\
2 & 4,500\\
3 & 4,745\\
4 & 4,942\\
5 & 5,136\\
6 & 4,394\\
\end{array}
\]
La droite des moindres carrés pour $z$ en $x$ : $z = 0,224x + 4,045$.
En revenant à $y$ :
\(\ln y = 0,224x + 4,045 \;\Longrightarrow\) \(y = e^{4,045}\, e^{0,224x} \) \(= 57,111 \times 1,251^x.\)

4. Comparaison des ajustements


Prévision pour $x=7$ (année 2007) :

Mayer : \(y = 28,3\times 7 + 35,1\) \( = 233,2 \approx 233\)
Moindres carrés : \(y = 29\times 7 + 32,7 = 235,7\) \( \approx 236 \)
Exponentiel : \(y = 57,111 \times 1,251^7\) \(\approx 274\)

La valeur réelle est 280, donc l'ajustement exponentiel est le plus pertinent.

III. Coefficient de corrélation linéaire


\[
r = \frac{\sigma_{xy}}{\sigma_x \,\sigma_y}.
\]
$|r|$ proche de 1 indique un bon ajustement linéaire ; $r = \pm 1$ correspond à des points alignés.
Dans l'exemple :
\[
r_{\text{affine}} \approx 0,987,\qquad
r_{\text{exp}} \approx 0,999,
\]
confirmant la supériorité de l'ajustement exponentiel.
Pour plus de détails, consulter le PDF ci-joint.
Discuter sur le forum
Lien copié !