Lycée JANSON DE SAILLY Année 2017-2018 STATISTIQUES 1re ES 2 I GÉNÉRALITÉS Les

Lycée JANSON DE SAILLY Année 2017-2018 STATISTIQUES 1re ES 2 I GÉNÉRALITÉS Les premières études statistiques étaient des recensements démographiques : on en a conservé le vocabulaire. Population : C’est l’ensemble sur lequel porte l’étude statistique. Individu : C’est un élément de la population. Caractère : C’est l’aspect que l’on observe sur les individus. Un caractère permet de déterminer une partition de la population selon ses diverses valeurs (par exemple le genre est un caractère à deux modalités : masculin ou féminin). Lorsque les différentes valeurs d’un caractère sont des nombres, le caractère est quantitatif. Dans le cas contraire, le caractère est qualitatif. L’effectif d’une valeur du caractère étudié est le nombre d’individus de la population ayant cette valeur. La fréquence d’une valeur est le quotient de l’effectif de cette valeur par l’effectif total de la population. ( la fréquence peut être exprimée en pourcentage ) féquence = effectif de la valeur effectif total II MÉDIANE ET QUANTILES 1 LA MÉDIANE La médiane d’une série statistique est une valeur telle qu’il y ait autant d’observations ayant une valeur supérieure à la médiane que d’observations ayant une valeur inférieure à la médiane. La médiane d’une série statistique de N valeurs rangées par ordre croissant est le nombre Me défini par : — si l’effectif N est impair, la médiane Me est la valeur centrale du caractère c’est à dire la valeur de rang N +1 2 de la série ordonnée. — si l’effectif N est pair, la médiane Me est la demi-somme des deux valeurs centrales du caractère c’est à dire la moyenne des valeurs de rangs N 2 et N 2 +1 de la série ordonnée. EXEMPLE Dans un service de maintenance, on a répertorié le nombre d’interventions par jour sur un mois. On a obtenu la distribution suivante : Nombre d’interventions xi 3 5 6 7 8 9 Nombre de jours ni 2 5 8 6 3 1 L’effectif total N = 25 donc la médiane est la valeur du caractère de rang 13 soit Me = 6. 2 LES QUANTILES LES QUARTILES Les quartiles au nombre de trois Q1, Q2 et Q3 partagent l’ensemble étudié de N éléments préalablement classés par valeurs croissantes, en quatre sous ensembles. — Le premier quartile noté Q1 est la plus petite valeur de la série statistique telle qu’au moins 25 % des valeurs de la série sont inférieures ou égales à Q1. — Le troisième quartile noté Q3 est la plus petite valeur de la série statistique telle qu’au moins 75 % des valeurs de la série sont inférieures ou égales à Q3. A. YALLOUZ (MATH@ES) Lycée JANSON DE SAILLY Année 2017-2018 STATISTIQUES 1re ES 2 Au moins 50% des valeurs Au moins 50% des valeurs Au moins 25% des valeurs Au moins 75% des valeurs xmin xmax Me Me Q1 Q3 REMARQUE L’intervalle interquartile [Q1;Q3] contient au moins 50% des valeurs de la série. EXEMPLE Dans la série précédente, l’effectif total N = 25. — 25× 1 4 = 6,25 donc le premier quartile est la valeur du caractère de rang 7 soit Q1 = 5. — 25× 3 4 = 18,75 donc le troisième quartile est la valeur du caractère de rang 19 soit Q3 = 7. LES DÉCILES Les déciles au nombre de neuf D1, D2, ..., D9 partagent l’ensemble étudié de N éléments préalablement classés par valeurs croissantes, en dix sous ensembles. — Le premier décile noté D1 est la plus petite valeur de la série statistique telle qu’au moins 10 % des valeurs de la série sont inférieures ou égales à D1. — Le neuvième décile noté D9 est la plus petite valeur de la série statistique telle qu’au moins 90 % des valeurs de la série sont inférieures ou égales à D9. 3 CARACTÉRISTIQUES DE DISPERSION — L’étendue est la différence entre la plus grande et la plus petite valeur d’une série statistique. — L’écart interquartile est égal à la différence entre le troisième et le premier quartiles. — L’écart interdécile est égal à la différence entre le neuvième et le premier déciles. 4 DIAGRAMME EN BOÎTE La représentation graphique de la dispersion d’une série statistique se fait à l’aide de diagramme en boîte appelés aussi « boîte à moustaches » ou « box-plot ». Pour une catégorie donnée, on construit, en face d’un axe permettant de repérer les quantiles de la variable étudiée, un rectangle dont la longueur est égale à l’écart interquartile Q3 −Q1, la médiane est représentée par un trait. On ajoute alors des segments aux extrémités menant jusqu’aux valeurs extrêmes, ou jusqu’aux premier et neuvième déciles. EXEMPLE Le tableau suivant donne la distribution du revenu salarial par secteur d’activité en France en 2014. D1 Q1 Médiane Q3 D9 Secteur privé 2 218 8 570 17 520 25 377 37 234 Secteur public 4 716 15 744 21 221 27 996 36 797 Source : INSEE A. YALLOUZ (MATH@ES) Lycée JANSON DE SAILLY Année 2017-2018 STATISTIQUES 1re ES 2 5 000 10 000 15 000 20 000 25 000 30 000 35 000 40 000 Secteur public Secteur privé III MOYENNE, VARIANCE ET ÉCART-TYPE 1 LA MOYENNE On considère la série statistique donnée par le tableau ci-contre. On note N = n1 +n2 +···+np l’effectif total Valeur xi x1 x2 ··· xp Effectif ni n1 n2 ··· np La moyenne d’une série statistique est le quotient noté x de la somme de toutes les valeurs de cette série par l’effectif total. x = n1 × x1 +n2 × x2 +···+np × xp N = 1 N p X i=1 ni xi REMARQUE Soit fi = ni N la fréquence de la valeur xi alors, la moyenne x = f1 × x1 + f2 × x2 +···+ fp × xp. EXEMPLE Avec la série statistique précédente : Nombre d’interventions xi 3 5 6 7 8 9 Nombre de jours ni 2 5 8 6 3 1 Fréquence fi 0,08 0,2 0,32 0,24 0,12 0,04 Le nombre moyen d’interventions par jour est : x = 2×3+5×5+8×6+6×7+3×8+1×9 25 = 6,16 ou en utilisant les fréquences : x = 0,08×3+0,2×5+0,32×6+0,24×7+0,12×8+0,04×9 = 6,16 2 VARIANCE ET ÉCART-TYPE Soit (xi;ni), 1 É i É p, une série statistique de moyenne x et d’effectif total N. — La variance de cette série est le nombre V défini par : V = n1 × ¡ x1 −x ¢2 +n2 × ¡ x2 −x ¢2 +···+np × ¡ xp −x ¢2 N = 1 N p X i=1 ni ¡ xi −x ¢2 — L’écart-type, noté σ, de cette série est égal à la racine carrée de la variance : σ = p V A. YALLOUZ (MATH@ES) Lycée JANSON DE SAILLY Année 2017-2018 STATISTIQUES 1re ES 2 REMARQUE La variance est la moyenne des carrés des écarts à la moyenne x. Les valeurs ¡ xi −x ¢ sont les « écarts à la moyenne »; les « carrés des écarts à la moyenne » sont donc ¡ xi −x ¢2. En faisant la moyenne des carrés des écarts à la moyenne, on trouve la variance. EXEMPLE Dans la série précédente de moyenne x = 6,16 la variance est : V = 2×(3−6,16)2 +5×(5−6,16)2 +8×(6−6,16)2 +6×(7−6,16)2 +3×(8−6,16)2 +1×(3−6,16)2 25 = 1,9744 L’écart-type de cette série est donc σ = p1,9744 ≈1,4 PROPRIÉTÉ Soit (xi;ni), 1 É i É p, une série statistique de moyenne x et d’effectif total N. La variance de cette série est le nombre V défini par : V = n1 × x12 +n2 × x22 +···+np × xp2 N −x2 = 1 N p X i=1 ni xi 2 −x2 ❊DÉMONSTRATION V = n1 × ¡ x1 −x ¢2 +n2 × ¡ x2 −x ¢2 +···+np × ¡ xp −x ¢2 N = n1 × ¡ x12 −2x1x + x2¢ +n2 × ¡ x22 −2x2x + x2¢ +···+np × ¡ xp2 −2xpx + x2¢ N = n1 × x12 +n2 × x22 +···+np × xp 2 N −2 n1 × x1 +n2 × x2 +···+np × xp N × x + n1 +n2 +···+np N × x2 = n1 × x12 +n2 × x22 +···+np × xp 2 N −2x × x + x2 = n1 × x12 +n2 × x22 +···+np × xp 2 N −x2 A. YALLOUZ (MATH@ES) uploads/Geographie/ statistiques-cours-2-2.pdf

  • 41
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager