INTERVALLE DE FLUCTUATION

     INTERVALLE DE FLUCTUATION  par l'exemple         TS1    mai 2013 

    . I.  INTERVALLE DE FLUCTUATION

          1.  On considère une population, par exemple, l'ensemble des français.

             On connaît le nombre de français par le recensement.

         2.  On s'intéresse à un caractère comme " avoir un téléphone portable ".

         3.  Il est parfaitement possible en consultant les achats dans les magasins

              et les abonnements souscrits de savoir exactement le nombre de français

              à avoir  un "téléphone portable."

         4. Les statistiques donnent donc la proportion p exacte de français qui ont

             un "téléphone portable".           p est  donc connu

             Soit   p = 70%.

          5. On peut considérer , au hasard, un échantillon de n citoyens français.  ( n entier non nul )

              Pour cet échantillon, on constate  la proportion   Fn   de personnes

              ayant un "téléphone portable".

         6. La question que l'on se pose est de savoir si cet échantillon est représentatif

            de la population totale.

               Si  Fn   est  dans  l'intervalle de fluctuation asymptotique   

                           intervalle-de-fluctuation-1.png

                           avec    n ≥ 30      np ≥ 5     n ( 1 - p)  ≥ 5 

               

                     Re241

            on dit que l'échantillon , au seuil de  1 - α  , avec  alpha.png   dans ] 0 ; 1 [ ,

               est  valide.

-----------------------------------------------------------------------------

             . II.     Valeurs  Particulières :

                  •  alpha.png  =  5%        1 - alpha.png=  95%

                        ualpha-1.png   ≈  1,96                

                  •  alpha.png  =  1%        1 − alpha.png=  99%

                        ualpha-1.png   ≈  2,58

----------------------------------------------------------------

         . III. Autres valeurs

        1.  On peut, par exemple, souhaiter considérer le seuil de 98%.

             Cela correspond   à     alpha.png  =  2 %        1  alpha.png=  98%

         2. Comment pour  alpha.png   dans ] 0 ; 1 [      trouver

                 ualpha-1.png     ?

             On utilise:     P( Z  ≤  uα  ) =  1  –  alpha.png/ 2    où   Z est de loi normale N( 0; 1 )              

                                   Puis on utilise la calculatrice à l'envers en introduisant  alpha.png

                                   de façon qu'elle donne   uα.

            Explications:  

                   •  Montrons que   P(  –  uα     Z  ≤  uα  ) = 2  P( Z  ≤  uα  ) – 1           

                      c-à-d                P(  –  uα     Z  ≤  uα  ) =  2  ∏(  uα  – 1 

                      sachant que     P(  –  uα    Z  ≤  uα  ) = 1  –  alpha.png    et que la fonction densité de probabilité

                       de la loi normale N ( 0 ,1 ) de  Z  est paire.                

                      Sur IR son intégrale est 1.

                      Gauss

                  explication-1.png

                 Ainsi :

              recherche-de-ualpha-2.png

            •  On utilise ensuite  soit la table de la loi normale soit la calculatrice.

                 TI 84

                 2ND      VAR 

                 à la ligne 3           inverseNorm(                              Sur les TI 82 c'est  fracNorm(

                 On considère:

                               inverseNorm( 1 -  α / 2 )      

                 Cela donne  une valeur approchée de 

                                                      ualpha-1.png

                Exemple:

                           α =  2 %                 1 -  α / 2 = 1 - 0,02 / 2 =  1 - 0,01 = 0,99

                   D'où :            ualpha-1.png      2,3263

            On peut retrouver facilement les valeurs particulières citées plus haut.      

_____________________________________________________________________

       .IV. Remarque :

         On élargit parfois légèrement l'intervalle de fluctuation au seuil de 95 %

         en considérant   1,96 ≈ 2   et remplaçant √( p ( 1 p ) )  par 1 / 2.

         On considère alors  comme intervalle:

            [ p 1 / √n  ,  p +  1 / √n ].

         Pourquoi ce choix:

           •  La fonction p →  p ( 1 p )  admet sur [ 0 ; 1] un maximum en p = 1 / 2.

              Ce maximum est  1 / 4.

               En effet  sa fonction dérivée    p  →  1 − 2 p     s'annule en  p = 1 / 2 

               en changeant de signe , d'abord positive sur [ 0 ; 1 / 2 ] puis négative

                sur [ 1 / 2 ; 1].

         • Ainsi on a  également  la fonction    p     √( p ( 1 -  p ) )

             qui admet un maximum en  p = 1 / 2  .

             Ce maximum est    √( 1 / 4 ) = 1 / 2

           • Donc on se permet de remplacer   √( p ( 1 p ) )   par   1 / 2

                 Ainsi :                               1,96 √( p ( 1 p ) )  ≈  2 × ( 1 / 2 )

            c-à-d                                1,96 √( p ( 1 p ) )  ≈   1                  

          d'où en reportant  l'intervalle de fluctuation au seuil de 95 %

                           [ p 1 / √n  ,  p +  1 / √n ].

 ------------------------------------------------------------------------------------------------------

   . V. Présentation de la notion d'intervalle de fluctuation.

     On veut savoir si un échantillon de n individus pour lequel on a une fréquence Fn

     d'un caractère binaire ( à deux issues ) , représente bien la population 

     pour laquelle la fréquence p du caractère étudié est connue.

      Si Fn   est dans l'intervalle de fluctuation 

        intervalle-de-fluctuation-1.png

     avec   n ≥ 30     np  ≥ 5     n( 1 − p ) ≥ 5   et     0 < α  < 1 

     on accepte au seuil de 1 − α   l'échantillon.

    Par exemple :  A et B se présentent à une élection auprès d'une population.

                           On s'intéresse au % obtenu par A.

         Le résultat final de l'élection est connu.

         Soit p le % obtenu à l'élection par A.

         On prend dans la liste des votants un échantillon de n électeurs à qui on demande 

         leur vote. Dans cet échantillon on connait le % obtenu par A et on le note Fn .

         Alors on se demande si cet échantilon est représentatif des votants au seuil de  1 − α 

         ou au risque de   α .

          •Si   n ≥ 30     np  ≥ 5     n( 1 − p ) ≥ 5   et     0 < α  < 1 

          et   que   Fn  est  dans l'intervalle de fluctuation 

                   intervalle-de-fluctuation-1.png  

            alors on répond oui.

           •Dans le cas où ce n'est pas le cas on répond non.

      En fait cela revient à considérer une v.a.r discrète Xn  de loi binomiale B( n , p ).

      Pour chacun des n  individus de l'échantillon, de façon indépendante, on associe 1 si

      c'est un individu " pour A " et 0  sinon.

      La probabilité que l'individu soit pour A étant p.

      Xn indique le nombre d'individus de l'échantillon qui ont voté  pour A.

     Pour l'échantillon la fréquence de " vote pour A " est Fn  =  Xn / n

     Prenons par exemple α = 5 %.

     L'intervalle de fluctuation au seuil de 95 % est :

      In   =  [   p – 1,96 √(pq) / √n ,  p + 1,96 √(pq)  / √n 

       Si   F est dedans alors  l'échantillon est représentatif au seuil de 95 %.

    -------------------------------------------------------------------------------------------------------------