Echantillonnage - Estimation T aleS I - Fluctuation d’´ echantillons L’´ echant

Echantillonnage - Estimation T aleS I - Fluctuation d’´ echantillons L’´ echantillonnage est l’´ etude des liens existants entre les param` etres, moyenne ou fr´ equence, des ´ echantillons pr´ elev´ es dans une population et ceux de la population elle-mˆ eme. 1) Position du probl` eme Dans une population donn´ ee, on connaˆ ıt la fr´ equence f d’un caract` ere. On r´ ep` ete n fois, de fa¸ con ind´ ependante, le choix d’un individu dans cette population de fa¸ con ` a constituer un ´ echantillon de taille n. On aimerait alors connaˆ ıtre, ou du moins estimer, sur cet ´ echantillon, la fr´ equence f ′ du caract` ere. Population fr´ equence f Echantillon fr´ equence f ′ taille n Echantillonnage (d´ eduction) Si Xn est la variable al´ eatoire ´ egale au nombre de personnes poss´ edant le caract` ere ´ etudi´ e dans notre ´ echantillon, Xn suit alors une loi binomiale B(n; f). On cherche donc ` a estimer la fr´ equence f ′ = Xn n . 2) Intervalle de fluctuation D´ efinition Lorsqu’on r´ ep` ete n fois la mˆ eme exp´ erience al´ eatoire, on obtient une s´ erie de n succ` es ou ´ echecs que l’on appelle ´ echantillon de taille n. Si on r´ ealise plusieurs ´ echantillons de mˆ eme taille, les fr´ equences de succ` es ou d’´ echecs calcul´ ees pour chaque ´ echantillon varient d’un ´ echantillon ` a l’autre. Ce ph´ enom` ene s’appelle la fluctuation d’´ echantillonnage. Exemple : On lance une pi` ece bien ´ equilibr´ ee (donc, la probabilit´ e d’obtention des ´ ev´ enements ”Pile” et ”Face” sont ´ egales ` a p = 0, 5) 100 fois successivement : – pour une 1` ere s´ erie de 100 lancers, on obtient 54 fois ”Pile”, soit une fr´ equence f ′ = 54 100 = 0, 54 ; – pour une 2` eme s´ erie de 100 lancers, on obtient 41 fois ”Pile”, soit une fr´ equence f ′ = 41 100 = 0, 41 ; – pour une 3` eeme s´ erie . . . Bien que ce ph´ enom` ene soit al´ eatoire, on sait que, d’apr` es la loi des grands nombres, plus la taille des ´ echantillons augmente, plus les fr´ equences observ´ ees se rapprochent, ou se stabilisent autour, d’une valeur limite f ′ = p = 0, 5. Dans l’exemple pr´ ec´ edent, on sait que mˆ eme si le nombre de succ` es varie d’une exp´ erience ` a l’autre, il sera rare (c’est-` a-dire la probabilit´ e sera faible) d’avoir une fr´ equence de ”Pile” tr` es faible ou tr` es grande (disons, par exemple, inf´ erieure ` a 0,1 ou sup´ erieure ` a 0,9). La notion d’intervalle de fluctuation permet de quantifier ce ph´ enom` ene : la fr´ equence de succ` es calcul´ ee sur un ´ echantillon de taille n donn´ e est comprise, avec une certaine probabilit´ e, dans un intervalle de valeurs, ou intervalle de fluctuation. Y. Morel xymaths.free.fr/Lycee/TS/ Echantillonnage - Estimation - TS - 1/8 D´ efinition Soit X une variable al´ eatoire qui suit la loi binomiale B(n; p) et 0 < α < 1. Dire que [a; b] est un intervalle de fluctuation au seuil 1 −α signifie que P (a ⩽X ⩽b) = 1 −α Propri´ et´ e Soit Xn une variable al´ eatoire suivant la loi binomiale B(n; p), alors pour tout α∈]0; 1[, on a lim n→+∞P Xn n ∈In  = 1 −α o` u In d´ esigne l’intervalle " p −uα p p(1 −p) √n ; p + uα p p(1 −p) √n # avec uα le nombre tel que, si X suit la loi normale N (0; 1), P(−uα ⩽X ⩽uα) = 1 −α L’intervalle In s’appelle l’intervalle de fluctuation asymptotique au seuil 1 −α. D´ emonstration: Si Xn suit la loi binomiale B(n; p), alors d’apr` es le th´ eor` eme de Moivre-Laplace, pour n assez grand, Xn suit approximativement la loi normale N (np; p np(1 −p)), et donc, Xn n suit approxi- mativement la loi normale N np n ; p np(1 −p) n ! , soit la loi normale N (p; σ), avec σ = r p(1 −p) n . On cherche alors δ tel que P  p −δ ⩽Xn n ⩽p + δ  = 1 −α. En ramenant Xn n ` a une variable suivant la loi normale r´ eduite N (0; 1) : P   −δ σ ⩽ Xn n −p σ ⩽δ σ   = 1−α La variable al´ eatoire X = Xn n −p σ suit une loi normale centr´ ee r´ eduite N (0; 1), et on sait donc qu’il existe un unique nombre uα tel que P(−uα ⩽X ⩽uα) = 1 −α . Le th´ eor` eme est donc v´ erifi´ e pour δ σ = uα ⇐ ⇒δ = uασ = uα r p(1 −p) n et on a donc, pour n assez grand, P Xn n ∈In  = 1 −α □ En pratique, la variable al´ eatoire Xn d´ esigne le nombre succ` es, c’est-` a-dire le nombre d’individus poss´ edant le caract` ere ´ etudi´ e, dans l’´ echantillon de taille n form´ e, et alors f ′ = Xn n est la fr´ equence de ce caract` ere dans l’´ echantillon. Cette propri´ et´ e fournit donc un intervalle In de fluctuation au seuil α. 3) Calcul pratique de l’intervalle de fluctuation Avec les valeurs approch´ ees, u0,05 ≃1, 96 et u0,01 ≃2, 58, on peut pr´ eciser les intervalles de fluctuation les plus utilis´ es, au seuil de 95 % et au seuil de 99 % : Y. Morel xymaths.free.fr/Lycee/TS/ Echantillonnage - Estimation - TS - 2/8 Corollaire Si n ⩾30, np ⩾5 et n(1 −p) ⩾5, alors, • l’intervalle de fluctuation au seuil de 95% est environ : " p −1, 96 p p(1 −p) √n ; p + 1, 96 p p(1 −p) √n # • l’intervalle de fluctuation au seuil de 99% est environ : " p −2, 58 p p(1 −p) √n ; p + 2, 58 p p(1 −p) √n # Exemple : On lance une pi` ece de monnaie bien ´ equilibr´ ee 100 fois successivement, et on compte le nombre de tirages ”Pile”. Ce ph´ enom` ene ´ etant al´ eatoire, on peut s’attendre ` a obtenir un nombre quelconque de tirages ”Pile” compris entre 0 et 100. N´ eanmoins, on imagine bien que, la pi` ece ´ etant ´ equilibr´ ee, obtenir un faible nombre (par exemple, inf´ erieur ` a 10) ou un fort nombre (par exemple, sup´ erieur ` a 90) de ”Pile” sera rare. L’intervalle de fluctuation permet de pr´ eciser cela. La probabilit´ e d’obtenir ”Pile” sur un lanc´ e est p = 0, 5, et donc de ne pas l’obtenir : q = 1 −p = 0, 5. Les lanc´ es successifs de la pi` ece ´ etant identiques et ind´ ependants entre eux, la variable al´ eatoire X100, qui au n = 100 lancers associe le nombre d’obtention de ”Pile”, suit la loi B(100; 0, 5). On a ici, n = 100 ⩾30 et np = n(1−p) = 50 ⩾5, et donc, d’apr` es la propri´ et´ e pr´ ec´ edente, l’intervalle de fluctuation au seuil de 95 % de la variable al´ eatoire X100 100 (le nombre moyen de ”Pile” obtenus, ou encore la fr´ equence de ”Pile” sur les 100 lancers) est :  p −1, 96 p p(1 −p) √n ; p + 1, 96 p p(1 −p) √n  =  0, 5 −1, 96 √0, 5 × 0, 5 √ 100 ; 0, 5 + 1, 96 √0, 5 × 0, 5 √ 100  ≃[ 0, 5 −0, 098 ; 0, 5 + 0, 098 ] = [ 0, 402 ; 0, 598 ] Dans 95% des cas, la fr´ equence f ′ de ”Pile” obtenue sera dans l’intervalle [0, 402 ; 0, 598]. De la mˆ eme fa¸ con, l’intervalle de fluctuation au seuil de 99% est : " p −2, 58 p p(1 −p) √n ; p + 2, 58 p p(1 −p) √n # ≃[0, 5 −0, 129 ; 0, 5 + 0, 129] = [0, 371 ; 0, 629] Dans 99% des cas, la fr´ equence f ′ de ”Pile” obtenue sur ces 100 lanc´ es sera comprise entre 0,371 et 0,629. Corollaire Si n ⩾30, np ⩾5 et n(1 −p) ⩾5, l’intervalle de fluctuation au seuil de 95% peut-ˆ etre approxim´ e par l’intervalle  p −1 √n ; p + 1 √n  D´ emonstration: L’intervalle de fluctuation au seuil de 95%, d’apr` es le th´ eor` eme pr´ ec´ edent est, avec α = 5% = 0, 05, " p −u0,05 p p(1 −p) √n ; p + u0,05 p p(1 −p) √n # Y. Morel xymaths.free.fr/Lycee/TS/ Echantillonnage uploads/Geographie/ cours-probabilites-echantillonnage-estimation.pdf

  • 35
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager