INFORMATIONS DE COURS BTS AJUSTEMENT LINEAIRE. Lundi 15 sept.08
Deux méthodes sont à connaître:
La méthode de MAYER et la méthode des Moindres Carrés.
1. METHODE DES MOINDRES CARRES.
On dispose d'une série statistique double quantitative: ( x1 , y1) , ..... ( (xn , yn ).
On considère le nuage de n points M1( x1 , y1) , .............., Mn( xn , yn ).
( n entier naturel non nul.)
On veut si l'on représente les points du nuage dans un repère orthonormal trouver une droite
Δ: y = a x + b qui passe le plus près possible des points du nuage.
( A condition que la forme du nuage le permette.)
a. Justification des formules utilisées pour la droite de régression de y en x.
On considère, pour cela les points de la droite Δ,
A1( x1 , a x1+ b) , ... , A( xn , a xn+b ) .
On veut trouver a et b de façon que la somme des carrés des distances
A1M1 , .......,AnMn soit la plus petite possible.
Les segments [A1M1 ] , ................. , [AnMn ] sont paralèlles à l'axe des ordonnées.
On considère donc : g( b ) = (A1M1)2 + ........... ..........+ ( AnMn )2 = f ( a )
• On dérive la fonction g de variable b . On cherche pour quelle valeur de b
g' (b ) = 0 .
g ( b ) = ∑1i=n ( ( yi - a xi )- b )2 = ∑1i=n ( ( yi - a xi ) 2 + b2 - 2 b ( yi - a xi ) )
Alors:
g' ( b ) = ∑1i=n ( 2 b - 2 ( yi - a xi )) = 2 ∑1i=n ( b - ( yi - a xi ))
g' ( b ) = 2 ( n b - ( ∑1i=n yi )+ a ( ∑1i=n xi ) )
g' ( b ) = 0 ssi n b = ( ∑1i=n yi ) - a ( ∑1i=n xi )
g' ( b ) = 0 ssi b = y‾ - a ¯x ( 1 )
Donc le point moyen G ( ¯x ., y‾ ) vérifie l'équation de Δ: y = a x + b.
L'équation de Δ est donc : y - y‾ = a ( x - ‾x ).
• Par ailleurs on a :(a ) = ( y1 - ( a x1 + b ) )2 +..................+ ( yn - ( a xn + b ) )2
f( a) = ∑1i=n ( yi - ( a xi + b ) )2 = ∑1i=n ( yi - b- a xi )2
f( a) = ∑1i=n ( yi - ( y‾ - a x‾ )- a xi )2 En remplaçant b d'après ( 1 )
f( a) = ∑1i=n ( ( yi - y‾ ) + a ( x‾ - xi ) )2
f( a) = ∑1i=n ( ( yi - y‾ )2 + a2 ( x‾ - xi )2 + 2 a ( yi - y‾ )( x‾ - xi ) )
f(a) = ( ∑1i=n ( yi - y‾ )2 ) + a2 ( ∑1i=n ( x‾ - xi )2 ) - 2 a ( ∑1i=n ( yi - y‾ )( xi - x‾ ) )
f ' (a) = 2 a ∑1i=n ( x‾ - xi )2 ) - 2 ( ∑1i=n ( yi - y‾ )( xi - x‾ ) )
f ' ( a) = 2 [ a ( ∑1i=n ( xi - x‾ i )2 ) - ∑1i=n ( yi - y‾ )( xi - x‾ ) ]
Anisi f ' ( a ) = 0 ssi a ( ∑1i=n ( xi - x‾ )2 ) - ∑1i=n ( yi - y‾ )(xi - x‾ ) = 0
f ' ( a ) = 0 ssi a = ( ∑1i=n ( yi - y‾ )( xi -x‾ ) ) / ∑1i=n ( xi - x‾ )2
f ' ( a ) = 0 ssi a = ( ∑1i=n ( yi - y‾ )( xi - x‾ ) ) / ∑1i=n ( xi - x‾ )2
En divisant par n le numérateur et le dénominateur il vient :
f '(a ) = 0 ssi a = cov( x , y ) / v(x)
( f ' ( a ) est minimale pour cette valeur de a .
f y admet alors un extrémum qui est un minimum.)
Conclusion:
et b = y‾ - a ¯x
2. PROPRIETE.
y = a x + b avec a = cov( x , y ) / v(x) = cov( x , y ) / ( σ(x) )²
Avec les mêmes hypothèses:
cov( x , y ) = ( ∑1i=n ( xi yi - x‾ y‾ ) ) / n
( Obtenue en développant la formule de cov ( x , y ) .
3. DEFINITION.
Le coefficient de corrélation est : r = cov( x , y ) / ( σ(x) σ( y ) )
- 1 < r < 1.
Plus la valeur absolue de r est proche de 1 plus la corrélation est bonne .
a et rsont de même signe.
4. Remarque. Dans les épreuves de BTS,
c'est la calculatrice qui donne a , b , r directement.
------------------------------------------------------------ -----------------------------------------