Cours de stat.

 

 

       INFORMATIONS DE COURS          BTS     AJUSTEMENT LINEAIRE.       Lundi 15 sept.08

                     Deux méthodes sont à connaître:

                    La méthode de MAYER  et  la méthode des Moindres Carrés.

      1. METHODE DES MOINDRES CARRES. 

            On dispose d'une série statistique double quantitative: ( x1 , y1) ,  .....    ( (xn , yn ).

            On considère le nuage de n points M1( x1 , y1) ,  ..............,  Mn( xn , yn ).        

            ( n entier naturel non nul.)

            On veut si l'on représente les points du nuage dans un repère orthonormal trouver une droite

             Δ: y = a x + b qui passe le plus près possible des points du nuage. 

          ( A condition que la forme du nuage le permette.)

          a. Justification des formules utilisées pour la droite de régression de y en x.

             On considère, pour cela les points de la droite Δ, 

              A1( x1 , a x1+ b) ,  ... ,  A( xn , a xn+b ) .

              On veut trouver a et b de façon que la somme des carrés des distances 

               A1M1 , .......,AnMn  soit la plus petite possible.

             Les segments  [A1M1 ] , ................. , [AnMn ] sont paralèlles à l'axe des ordonnées.

             On considère donc : g( b ) =    (A1M1)2      +     ........... ..........+      ( AnMn )2  = f ( a )

            • On dérive la fonction g  de variable b . On cherche pour quelle valeur de b  

              g' (b ) = 0 .     

              g ( b ) =  1i=n ( ( y- a xi )- b )2     = 1i=n ( (  yi -   a xi  ) 2   + b2  - 2 b ( y- a xi  ) )   

               Alors:            

                  g' ( b ) =    1i=n     (  2 b - 2 ( y- a xi  ))      = 2  1i=n     (   b -  ( y- a xi  ))   

              g' ( b ) = 2 (    n b - (  1i=n    yi     )+ a  ( 1i=n xi  ) )                                                        

              g' ( b ) = 0            ssi   n b =   1i=n    yi     ) - a  ( 1i=n xi  ) 

              g' ( b ) = 0         ssi           b =   y‾  - a  ¯x       ( 1 )

              Donc le point moyen  G ( ¯x ., y‾    )   vérifie l'équation  de Δ: y = a x + b.

                               L'équation de Δ est donc :     y -  y‾   = a ( x - ‾x ).                         

              • Par ailleurs on a :(a ) = ( y1 - ( a x1 + b ) )2  +..................+ ( yn - ( a xn + b ) )2   

              f( a) =  1i=n  ( yi - ( a xi + b ) )2  = 1i=n ( yi - b- a xi  )2 

              f( a) = 1i=n  ( yi - ( y‾ - a x‾ )- a xi  )2    En remplaçant b  d'après ( 1 )

               f( a) = 1i=n  ( ( yi -  y‾ ) + a  ( x‾ -  xi ) )2 

                f( a) = 1i=n  ( ( yi -  y‾ )2 + a2  ( x‾ -  xi )2 + 2 a ( yi -  y‾ )( x‾ -  xi ) )                                                

                 f(a) = ( 1i=n   ( yi -  y‾ )2  ) + a2  ( 1i=n ( x‾ -  xi )2 ) - 2 a ( 1i=n ( yi -  y‾ )( xi - x‾  ) )     

                                            f ' (a) =       2 a  1i=n ( x‾ -  xi )2 )    -  2  ( 1i=n ( yi -  y‾ )( xi - x‾   ) ) 

                                  f ' ( a) = 2 [ a  ( 1i=n ( xi - x‾ i )2 )  -   1i=n  ( yi -  y‾ )( xi - x‾  )    ]

                         Anisi  f ' ( a ) = 0  ssi    a  ( 1i=n ( xi  - x‾ )2 )  -   1i=n  ( yi -  y‾ )(xi - x‾  )   = 0

 

                                   f ' ( a ) = 0       ssi         a = ( 1i=n  ( yi -  y‾ )( xi -x‾  )  ) /  1i=n ( xi - x‾  )2

                                               f ' ( a ) = 0          ssi   a = ( 1i=n  ( yi -  y‾ )( xi  - x‾  )  ) /  1i=n ( xi  - x‾  )2

 

                              En divisant par n le numérateur et le dénominateur il vient :

                              f '(a ) = 0  ssi    a = cov( x , y )   /   v(x)  

                         (  f ' ( a ) est minimale pour cette valeur de a . 

                             f  y admet alors un extrémum qui est un minimum.)

                       Conclusion:   

 y = a x + b  avec    a = cov( x , y )   /  v(x)    = cov( x , y )   /  ( σ(x) )²  

                                                  et    b =   y‾  -  a  ¯x  

                   2. PROPRIETE.

                           Avec les mêmes hypothèses:

                                             cov( x , y )  = ( 1i=n  ( yi - y‾ )( xi  - x‾  )  ) / n                       v(x) =(  1i=n ( xi - x‾  )) /  n

 

 

                                  cov( x , y )  = ( 1i=n    xi y- x‾ y‾ )  ) / n     

                            ( Obtenue en développant la formule de cov ( x , y ) .

                   3. DEFINITION.

                    Le coefficient de corrélation est :       r = cov( x , y )   / (  σ(x)  σ( y ) )   

                        - 1 < r  < 1.

                     Plus  la valeur absolue de r  est proche de 1   plus la corrélation est bonne .

                     a et  rsont de même signe.   

                    4. Remarque.      Dans les épreuves de BTS, 

                                             c'est la calculatrice qui donne a , b , r directement.

                    ------------------------------------------------------------                                          -----------------------------------------