INTERVALLE DE CONFIANCE TS
------------------------------------------------------------------------------------------------------
1.INFORMATION :
Le fait d'extraire d'une population n individus avec n ≥ 30
peut s'apparenter à un tirage avec remise de n individus dans la population.
C'est ce qui arrive quand on réalise un sondage.
Le problème après c'est de savoir si le résultat f du sondage donne
une idée fiable au niveau de la population.
C'est le but de l'intervalle de confiance.
-------------------------------------------------------------------------------------------------------------
2. INTERVALLE DE CONFIANCE IC.
On considère une population et on s'intéresse à une particularité ( caractère binaire)
de certains individus de la population.
On souhaite pouvoir encadrer la proportion p des individus de la population
ayant cette particularité. Mais on ne connait pas p.
Autrement dit on veut donner un intervalle de confiance IC
qui contienne la proportion p avec une probabilité d'au moins
95% . ( On dit au niveau de confiance asymptotique 95% ou au seuil de risque 5 % )
Pour cela on considère un échantillon de n individus. ( n ≥ 30 ).
Soit f la proportion d'individus, dans l'échantillon, ayant la particularité.
On considère comme intervalle de confiance :
IC = [ f - 1 / √n , f + 1 / √n ]
En pratique on accepte cet intervalle que si les trois conditions
n ≥ 30
n × f ≥ 5
n × ( 1 - f ) ≥ 5
sont réalisées.
--------------------------------------------------------------------------------------------------
3. EXEMPLE DE SITUATION .
On s'intéresse à la proportion de motard dans une population.
On ne connait pas statistiquement la proportion p de motard dans
la population. On désire l'encadrer avec une certaine fiabilité.
On réalise un sondage par téléphone auprès de 100 individus de la population.
n = 100
On a dénombré 22 individus qui sont motards dans cet échantillon.
Donner un IC asymptotique au niveau de confiance 95 %.
-----------------------------------------------------------------------------------------------------------
REPONSE:
On a la fréquence de "motard " pour l'échantillon qui est :
f = 22 / 100 = 0,22
• n = 100
100 ≥ 30
Donc n ≥ 30
• n × f = 100 × f = 100 × 0,22 = 22
Donc
100 × f ≥ 5
• n × ( 1 − f ) = 100 × ( 1 − f ) = 100 × 0,88 = 88
Donc n × ( 1 - f ) ≥ 5
Considérons comme IC :
I100 = [ 0,22 - 1 / √100 , 0,22 + 1 / √100 ]
c-à-d
I100 = [ 0,22 - 0,1 , 0,22 + 0,1 ]
Conclusion :
I100 = [ 0,12 , 0,32 ]
On peut considérer que la proportion p de motard dans la population( totale )
se situe entre 12 % et 32 % au seuil de confiance asymptotique de 95 %.
On peut constater que l'amplitude de cet intervalle de confiance est 2 / √n = 20 %.
ce qui est considérable.
On obtient donc quand on prend le centre de cet intervalle pour la proportion p ,
un pourcentage ici 22 % à ± 10 % près.
On peut dire que dans la population à 10% près, la proportion de motard est 22 %.
-------------------------------------------------------------------------------------------
Question : Combien de personnes faut-il interroger pour que le résultat du sondage soit
à 1 % près quand on considère le milieu de l'intervalle de confiance?
-------------------------------------------------------------------------------------------------------------
REPONSE:
1 / √n = 1 %
donne
√ n = 100
c-à-d n = 10 000
Cela montre que pour une simple pécision de ± 1% il faut interroger 10 000 personnes.
Les instituts interrogent environ n = 700 personnes.
1 / √ 700 ≈ 0,0378 soit 3, 78 %
Le centre de l'intervalle de fluctuation est valable à ± 3,78 % près et en plus
au seuil de rique de 5%. Autrement dit c'est sans intérêt.
-------------------------------------------------------------------------------------------------------------------------
4. Autre aspect de l'intervalle de confiance.
On veut savoir quelle est la fréquence prévisible d'un caractère binaire ( à deux issues )
dans une population, connaissant la fréquence f du caractère dans un échantillon
de n individus de la population ( n ≥ 30 ) .
Par exemple :
A et B se présentent à une élection. Avant d'avoir le résultat final, on fait un sondage
avec n bulletins ( n ≥ 30 ) au début du dépouillement pour connaitre le pourcentage f
dans cet échantillon.
On veut pouvoir prédire le pourcentage p final obtenu par A au seuil de 95 %.
Le pourcentage p de A final sera dans un intervalle de confiance
au seuil de 95 % si nf ≥ 5 et n( 1 − f ) ≥ 5.
p est dans l'intervalle de confiance :
IC = [ f − 1 / √n , f + 1 / √n ]
Ainsi pour n = 400 l'amplitude de IC est de 10% .
Ce qui est énorme comme amplitude
--------------------------------------------------------------------------------