STAT. BTS

 

 

       INFORMATIONS DE COURS          BTS     AJUSTEMENT LINEAIRE.       Lundi 15 sept.08

                     Deux méthodes sont à connaître:

                    La méthode de MAYER  et  la méthode des Moindres Carrés.

      1. METHODE DES MOINDRES CARRES. 

            On dispose d'une série statistique double quantitative: ( x1 , y1) ,  .....    ( (xn , yn ).

            On considère le nuage de n points M1( x1 , y1) ,  ..............,  Mn( xn , yn ).        

            ( n entier naturel non nul.)

            On veut si l'on représente les points du nuage dans un repère orthonormal trouver une droite

             Δ: y = a x + b qui passe le plus près possible des points du nuage. 

          ( A condition que la forme du nuage le permette.)

          a. Justification des formules utilisées pour la droite de régression de y en x.

             On considère, pour cela les points de la droite Δ, 

              A1( x1 , a x1+ b) ,  ... ,  A( xn , a xn+b ) .

              On veut trouver a et b de façon que la somme des carrés des distances 

               A1M1 , .......,AnMn  soit la plus petite possible.

             Les segments  [A1M1 ] , ................. , [AnMn ] sont paralèlles à l'axe des ordonnées.

             On considère donc : g( b ) =    (A1M1)2      +     ........... ..........+      ( AnMn )2  = f ( a )

            • On dérive la fonction g  de variable b . On cherche pour quelle valeur de b  

              g' (b ) = 0 .     

              g ( b ) =  1i=n ( ( y- a xi )- b )2     = 1i=n ( (  yi -   a xi  ) 2   + b2  - 2 b ( y- a xi  ) )   

               Alors:            

                  g' ( b ) =    1i=n     (  2 b - 2 ( y- a xi  ))      = 2  1i=n     (   b -  ( y- a xi  ))   

              g' ( b ) = 2 (    n b - (  1i=n    yi     )+ a  ( 1i=n xi  ) )                                                        

              g' ( b ) = 0            ssi   n b =   1i=n    yi     ) - a  ( 1i=n xi  ) 

              g' ( b ) = 0         ssi           b =   ¯y    - a  ¯x       ( 1 )

              Donc le point moyen  G ( ¯x , ¯y    )   vérifie l'équation  de Δ: y = a x + b.

                               L'équation de Δ est donc :     y -  ¯y     = a ( x - ¯x ).                         

              • Par ailleurs on a :  f(a ) = ( y1 - ( a x1 + b ) )2  + .................. + ( yn - ( a xn + b ) )2   

              f( a) =  1i=n  ( yi - ( a xi + b ) )2  = 1i=n ( yi - b- a xi  )2 

              f( a) = 1i=n  ( yi - ( y‾ - a x‾ )- a xi  )2    En remplaçant b  d'après ( 1 )

               f( a) = 1i=n  ( ( yi -  y‾ ) + a  ( x‾ -  xi ) )2 

               f( a) = 1i=n  ( ( yi -  y‾ )2 + a2  ( x‾ -  xi )2 + 2 a ( yi -  y‾ )( x‾ -  xi ) )                                                

               f(a) = ( 1i=n   ( yi -  y‾ )2  ) + a2  ( 1i=n ( x‾ -  xi )2 ) - 2 a ( 1i=n ( yi -  y‾ )( xi - x‾  ) )     

                                            f ' (a) =       2 a  1i=n ( x‾ -  xi )2 )    -  2  ( 1i=n ( yi -  y‾ )( xi - x‾   ) ) 

                                 f ' ( a) = 2 [ a  ( 1i=n ( xi - x‾ i )2 )  -   1i=n  ( yi -  y‾ )( xi - x‾  )    ]

                         Anisi  f ' ( a ) = 0  ssi    a  ( 1i=n ( xi  - x‾ )2 )  -   1i=n  ( yi -  y‾ )(xi - x‾  )   = 0

 

                                   f ' ( a ) = 0       ssi         a = ( 1i=n  ( yi -  y‾ )( xi -x‾  )  ) /  1i=n ( xi - x‾  )2

                                               f ' ( a ) = 0          ssi   a = ( 1i=n  ( yi -  y‾ )( xi  - x‾  )  ) /  1i=n ( xi  - x‾  )2

                               En divisant par n le numérateur et le dénominateur il vient :

                              f '(a ) = 0  ssi    a = cov( x , y )   /   v(x)       avec  cov( x , y ) =( 1i=n  ( yi -  y‾ )( xi  - x‾  )  ) / n

                                                                                                                                          et  v(x) = (  1i=n ( xi  - x‾  )2 ) /n

                         (  f ( a ) est minimale pour cette valeur de a . )

                           f  y admet alors un extrémum qui est un minimum.)

                       Conclusion:   

 y = a x + b  avec    a = cov( x , y )   /  v(x)    = cov( x , y )   /  ( σ(x) )²  

                                                  et    b =   y‾  -  a  ¯x  

                   2. PROPRIETE.

                           Avec les mêmes hypothèses:

                                             cov( x , y )  = ( 1i=n  ( yi - y‾ )( xi  - x‾  )  ) / n                       v(x) =(  1i=n ( xi - x‾  )) /  n

 

 

                                  cov( x , y )  = ( 1i=n    xi y- x‾ y‾ )  ) / n  =   ( 1i=n   xi y ) /n   -  x‾ y‾  

 

                            ( Obtenue en développant la formule de cov ( x , y ) .

                   3. DEFINITION.

                    Le coefficient de corrélation est :       r = cov( x , y )   / (  σ(x)  σ( y ) )   

                        - 1 < r  < 1.

                     Plus  la valeur absolue de r  est proche de 1   plus la corrélation est bonne .

                     a et  rsont de même signe.   

                    4. Remarque.      Dans les épreuves de BTS, 

                                             c'est la calculatrice qui donne a , b , r directement.

                    ------------------------------------------------------------                                          -----------------------------------------

                   5. EXERCICE.

 

 

                           On considère la série pondérée suivante.

xi 3 3 5 5 7 9
yi 4 6 6 8 6 8
ni 3 2 4 1 2 8

                            Le nuage de points comporte 20 points pas forcément distincts.

                       a.  Vérifier, à l'aide de la calculatrice, que la droite de régression de y en x est : 

                            y = 0,4943 x +3,4861   avec une précision de 1O-4 .

                           ( Attention il faut introduire les 20 couples.)

                       b. Vérifier que le coefficient de corrélation r = 0,8554   avec une précision de 1O-4 .  

              Démarche:

               ◊ TI 84

 

                                    Effacer les liste L1  et L2.            

             Pour cela, faire:                    [ STAT ]     ClrList       ENTER    L1  , L2   ENTER

             Ensuite:                               [ STAT ]        ENTER    R emplir les 20 couples ( xi  , yi  )

                                                                               dans les deux premières colonnes.

                                                         [ STAT ]      →   4   ENTER 

                                  Il apparait:  y =a x + b

                                                     a =

                                                     b =

                                                     r2 =

                                                     r =

 

             ◊ TI 83          Si la corrélation  r ne s'affiche pas, faire:

 

                                 [ 2nd]     CATALOG   DiagnosticOn  ENTER  

 

            ◊ CASIO Graph 25      ( Pour la méthode des moindres carrés )

                                Effacement des listes :   [ MENU ]   [ STAT ]  [ EXE ]    DEL A     

                                Sélectionner la colonne puis   YES    [ EXE ]   

                                Rentrer les valeurs de xi  en colonne List 1

                                Rentrer les valeurs de yi  en colonne List 2

                                Régler les colones par CALC   SET

                                 2 VAR X  List : List 1

                                 2 VAR  Y  List :  List 2

                                 2  VAR Freq : 1          [EXE]

                                 Affichage des résultats par REG  X

                 6 . EXERCICE.

 

                       Mêmes questions avec la série statistique définie par le tableau:                   

        

x 2 3 4 5 6 7 8 9 10 11
y 15 26 43 45 60 80 85 97 108 129

                          Réponses à trouver :    y = 12,1818 x - 10,3818                r = 0,9945

                 7. EXERCICE.

                          On considère la série statistique double ( xi , pi ) définie par le tableau:             

xi 1 2 3 4 5
pi 7550 9235 10741 12837 15655
yi = lnpi

 

 

 On pose :  yi = ln (pi )

            a. Compléter le tableau  à 1O- 3 près .

            b.  Trouver la droite D: y = a x + b  de régression avec la calculatrice de y en x. ( Avec la méthode des moindres carrés.)

            c. Trouver à la calculatrice le coefficient de corrélation  r .

            d.  Donner une estimation de y pour x = 7, puis une estimation entière de p pour x = 7.

            e.  Exprimer p en fonction de x à l'aide y = a x + b .

                 (Cette relation est un ajustement non linéaire de p en x.)   

                 Réponses attendues:   

                   a.

xi 1 2 3 4 5
pi           7550 9235 10741 12837 15655
yi  = ln pi    8.9293 9.1308 9.2818 9.4601 9.6585

 

 

                                         b.        y = 0,179 x + 8,756.

                                         c.             r = 0,999

                                         d.            Pour x = 7   on a    y = 10,009

                                                      Pour x = 7  on a   p = 22 225,5987 soit p = 22 226

                                           e.            p =6348,666 e0,179 x

               METHODE   MANUELLE pour la question 1.

 

           x‾   = 15 / 5   = 3

           y‾     =  46.4605 / 5 = 9.2921              cov(x , y ) = (141.1692 / 5 ) - 3 × 9.2921  =  0.3575       

 

xi 1 2 3 4 5 ∑  = 15
yi 8.9293 9.1308 9.2818 9.4601 9.6585 ∑  = 46.4605
xi yi 8.9293 18.2616 27.8454 37.8404 48.2925 ∑  = 141.1692
( xi - x‾  ) - 2 - 1 0 1 2
( xi - x‾  )2 4 1 0 1 4 ∑ = 10

  

( yi - y‾  )2     ∑  =
    

            V( x) = 10 / 5 = 2

 

 

                   a =  cov( x , y ) / V(x) = 0.3575  /  2 = 0.1788            

                   b = y‾  - a x‾  = 9.2921 - 0.1788 ×3 = 8.7557

                 On retrouve la même droite de régression.

                      σ(x) = √(V(x) ) = √2 = 1.4142

                       σ(y) = √(V(y) )  

                      r = cov(x,y ) / ( σ(x) × σ(y ) )

 

 

                 ------------------------------              -----------------------------                          ---------------------------------