Série statistique à deux variables

Il arrive souvent qu'on observe conjointement deux caractères statistiques pour déterminer s'il existe une corrélation entre les deux



Catégories :

Mathématiques élémentaires

Page(s) en rapport avec ce sujet :

  • Alors une série statistique à deux variables est la totalité des couples () 1.... La décision d'ajuster un nuage par une droite se prend jusqu'désormais à la.... Nous ne considérons à présent que les droites D qui passent par le point... (source : astroplus.perso.neuf)
  • Représenter un nuage de point, tracer une droite d'ajustement donnée ou non, ... Une série statistique à deux variables est nommée série chronologique... (source : wicky-math.fr)
  • Une série statistique à deux variables est obtenue en étudiant deux caractères d'une même.... Cependant, le nuage de point associé ne semble pas s'ajuster... (source : reymarlioz.free)
Icone math élém.jpg
Cet article est membre de la série
Mathématiques élémentaires
Algèbre
Logique
Arithmétique
Probabilités
Statistiques

Il arrive souvent qu'on observe conjointement deux caractères statistiques pour déterminer s'il existe une corrélation entre les deux (âge et taille des enfants entre 0 et 20 ans, prix du m² et année, allongement du ressort et force appliquée, etc. )

Traitement des données

Pour chaque individu, on relève la valeur de deux caractères x et y. On obtient alors une liste de couples de nombres (xi;yi) qu'on peut présenter sous forme d'un tableau.

Exemple 1 : moyenne de l'année et note à l'examen pour un échantillon de 24 personnes.

Note de l'année 8 9 7 15 12 12 10 8
Note à l'examen 7 9 4 17 13 15 9 13
Note de l'année 11 11 7 8 11 11 12 12
Note à l'examen 14 9 11 10 9 12 17 12
Note de l'année 7 9 9 5 9 5 10 4
Note à l'examen 8 15 12 7 14 12 11 7

Exemple 2 : Masse appliquée (en gramme) et longueur du ressort (en cm).

Masse en grammes 7 10 18 20 5 24 12 3
Longueur en cm 8.5 9 10.5 11 8 11.8 9.4 7.5

Caractéristiques numériques

On peut étudier scindément chaque caractère statistique et calculer leur moyenne \overline{x} et \overline{y}, médiane, quartile, écart type σx et σy, variance V (x) et V (y).

On aura besoin de définir des quantités qui font intervenir conjointement les deux caractères :

Représentation graphique

Chaque couple de réels (xi, yi) définit un point Mi de coordonnées (xi, yi) . La totalité de ces points se nomme un nuage de points. Il arrive que deux points aient les mêmes coordonnées, ils seront alors représentés par un point dont la surface sera deux fois celle des autres.

On peut aussi placer le point moyen. C'est le point G dont les coordonnées sont (\overline{x},\overline{y})

Le nuage de points est un bon indicateur pour vérifier une corrélation entre les caractères x et y. Si les points sont sous la forme d'un nuage, il est fort à parier que les phénomènes ne sont pas corrélés. S'ils semblent dessiner une courbe, on cherchera à déterminer la nature de la courbe en procédant à un ajustement.

Exemple 1 : Nuage de points donnant la note à l'examen selon la moyenne de l'année.

Nuage1.png

L'observation du nuage de points laisse supposer qu'il n'existe pas de corrélation nette entre les notes de l'année et les notes à l'examen. Le calcul du cœfficient de corrélation donne pour résultat 0, 6 trop faible pour conclure à une corrélation. On peut cependant observer qu'une grande partie du nuage est localisé au-dessus de la droite d'équation y = x ce qui laisse penser que les élèves se sont mieux sortis de l'examen que du contrôle continu.

Exemple 2 : Nuage de points donnant la longueur du ressort selon la masse appliquée.

Nuage2.png

Les points semblent alignés. On va par conséquent tenter un ajustement affine.

Ajustement

Ajustement affine

Si les points semblent alignés, on détermine la droite d'ajustement grâce à une régression linéaire.

La droite d'ajustement a pour équation :

y=\dfrac{cov(x,y)}{V(x)}(x-\overline{x})+\overline{y}

Elle passe par le point moyen G.

Cet ajustement est reconnu comme valide si le cœfficient de corrélation linéaire r est en valeur absolue supérieur à \sqrt{3}/2

Exemple du ressort

La droite de régression a pour équation y = 0, 2x + 7 et le cœfficient de corrélation est quasiment égal à 1. On peut par conséquent affirmer sans trop d'erreur que l'allongement du ressort est proportionnel à la masse appliquée (lois de déformation élastique). Le fait que les points ne soient pas précisément alignés provient des erreurs ou imprécisions des mesures.

Nuage ajuste.png

Ajustement exponentiel

Si les points semblent dessiner une exponentielle, il n'est pas correct de tenter un ajustement affine. Pour vérifier la corrélation exponentielle, il est bon de tracer un nouveau nuage de point de coordonnées (xi, zi = ln (yi) ) , ou bien de tracer le nuage de points dans un repère semi-logarithmique. Si les points semblent alignés, on peut tenter un ajustement affine de zi selon xi.

Si la droite d'ajustement a pour équation z = ax + b, cela veut dire que ln (y) = ax+b. Il existe par conséquent une relation exponentielle entre y et x :

y = \mathrm{e}ˆb\times \mathrm{e}ˆ{ax} = K\mathrm{e}ˆ{ax}

Les formules de régression linéaire donnent

Et si on nomme yg, la moyenne géométrique des yi, on remarque que

K = \dfrac{y_g}{\mathrm{e}ˆ{a\overline{x}}}

La courbe passe alors par le point G'(\overline{x}, y_g)

Exemple 3 : Evolution de l'actif net d'une mutuelle de 1988 à 1997 (d'après bac Nouvelle Calédonie décembre 2000).

année depuis 1900 : xi 88 89 90 91 92 93 94 95 96 97
Actif net en milliards d'Euros : yi 5, 89 6, 77 7, 87 9, 11 10, 56 12, 27 13, 92 15, 72 17, 91 22, 13
zi = ln (yi) 1, 7733 1, 9125 2, 0631 2, 2094 2, 358 2, 5072 2, 6333 2, 7549 2, 8854 3, 0969

Le tracé du nuage de points montre plutôt le dessin d'une fonction exponentielle. Le soupçon est confirmé par le tracé du nuage de points de coordonnées (xi;zi) qui donne des points presque alignés.

L'ajustement affine de z selon x conduit à l'équation z = 0, 143x - 10, 813 avec un cœfficient de corrélation voisin de 1.

On peut par conséquent affirmer que l'évolution de l'actif semble être une fonction exponentielle de l'année :

y = e0, 143x − 10, 813
Nuage exp.png Tracé du nuage et de l'ajustement exponentiel

Ajustement sous forme de puissance

Il est envisageable aussi que la relation soit sous forme de puissance. Le phénomène est complexe à voir sur le nuage de point. Si on soupçonne une corrélation du type puissance, on trace le nuage des points de coordonnées (ti = ln (xi), zi = ln (yi) ) , ou bien on trace le nuage de points de coordonnées (xi, yi) dans un repère log-log. Si les points paraissent alignés on tente une régression linéaire de zi selon ti.

Si la droite d'ajustement a pour équation z = at + b, cela veut dire que ln (y) = aln (x) +b. Il existe par conséquent une relation en puissance entre y et x :

y = \mathrm{e}ˆb\times xˆa= Kxˆa

Les formules de régression linéaire donnent

Et si on nomme yg, la moyenne géométrique des yi et xg, la moyenne géométrique des xi on remarque que

K = \dfrac{y_g}{x_gˆa}

La courbe passe alors par le point Mg (xg, yg)

Exemple : Étude de la période de certaines planètes selon le demi-grand axe de leur trajectoire.

Planète demi grand axe a en 109 m période T en 106s ln (a) ln (T)
Mercure 57, 9 7, 59 4, 059 2, 025
Venus 108, 2 19, 36 4, 684 2, 863
Terre 149, 6 31, 47 5, 008 3, 449
Mars 227, 9 59, 19 5, 429 4, 081
Jupiter 778, 3 373, 32 6, 657 5, 992

Une représentation du nuage de points dans un repère log-log présente des points presque alignés.

Un ajustement linéaire de ln (T) selon ln (a) conduit à l'équation :

ln (T) = 1, 5ln (a) - 4, 062

avec un cœfficient de corrélation linéaire particulièrement proche de 1.

Ce qui conduit à la relation suivante :

T =\dfrac{aˆ{3/2}}{k}
\dfrac{aˆ3}{Tˆ2}=K conforme avec la troisième loi de Kepler

Voir aussi

Recherche sur Amazon (livres) :



Ce texte est issu de l'encyclopédie Wikipedia. Vous pouvez consulter sa version originale dans cette encyclopédie à l'adresse http://fr.wikipedia.org/wiki/S%C3%A9rie_statistique_%C3%A0_deux_variables.
Voir la liste des contributeurs.
La version présentée ici à été extraite depuis cette source le 10/03/2010.
Ce texte est disponible sous les termes de la licence de documentation libre GNU (GFDL).
La liste des définitions proposées en tête de page est une sélection parmi les résultats obtenus à l'aide de la commande "define:" de Google.
Cette page fait partie du projet Wikibis.
Accueil Recherche Aller au contenuDébut page
ContactContact ImprimerImprimer liens d'évitement et raccourcis clavierAccessibilité
Aller au menu