Université PARIS-VI Pierre et Marie Curie Faculté de Médecine Pitié-Salpêtrière

Université PARIS-VI Pierre et Marie Curie Faculté de Médecine Pitié-Salpêtrière Statistiques PCEM1 2001 - 2002 J.F. BOISVIEUX J.L. GOLMARD A. MALLET V. MORICE Mise à jour : 15 janvier 2002 Relecture : V. Morice et S. Tezenas Sommaire 2001 - 2002 Biostatistiques - Boisvieux, Golmard, Mallet & Morice 3/159 Sommaire 3 Sommaire 9 1 La variabilité et l’incertain 10 2 La décision dans l’incertain 11 Chapitre 1 : Statistique(s) et Probabilité(s) 11 1.1 Statistique 11 1.2 Population et échantillon 12 1.3 Statistique et probabilité 15 Chapitre 2 : Rappels mathématiques 15 2.1 Ensembles, Eléments 15 2.2 Opérations sur les ensembles, diagrammes de Venn 17 2.3 Ensembles finis, dénombrables, non dénombrables 17 2.4 Ensembles produits 18 2.5 Familles d’ensembles 18 2.6 Autres rappels mathématiques 18 2.6.1 Rappel sur les sommes 19 2.6.2 Rappel sur les intégrales 21 Chapitre 3 : Eléments de calcul des Probabilités 21 3.1 Introduction 21 3.2 Ensemble fondamental et événements 22 3.3 Opérations sur les événements 23 3.4 Règles du calcul des probabilités 24 3.5 Remarque 25 3.6 Illustration de quelques ensembles probabilisés 25 3.6.1 Ensemble probabilisé fini 25 3.6.2 Ensemble fini équiprobable 26 3.6.3 Ensembles probabilisés infinis 26 3.6.3.1 Cas dénombrable 27 3.6.3.2 Cas d’un ensemble probabilisé infini non dénombrable 29 Chapitre 4 : Probabilité Conditionnelle ; Indépendance et Théorème de Bayes 29 4.1 Probabilité conditionnelle Sommaire 4/159 Biostatistiques - Boisvieux, Golmard, Mallet & Morice 2001 - 2002 30 4.2 Théorème de la multiplication 31 4.3 Diagramme en arbre 32 4.4 Théorème de Bayes 34 4.5 Indépendance entre événements 34 4.6 Indépendance, inclusion et exclusion de deux événements 37 Chapitre 5 : Variables aléatoires 37 5.1 Définition d’une variable aléatoire 38 5.2 Variables aléatoires finies 38 5.2.1 Représentation d’une loi de probabilité finie 38 5.2.2 Espérance mathématique d’une loi finie 41 5.2.3 Variance et écart-type 41 5.2.4 Loi de probabilité produit 43 5.2.5 Variables aléatoires indépendantes 43 5.2.6 Fonction de répartition 43 5.3 Variables infinies dénombrables 44 5.4 Variables aléatoires continues 47 Chapitre 6 : Exemples de distributions 47 6.1 Lois discrètes 47 6.1.1 Loi de Bernoulli 47 6.1.2 Loi binomiale 50 6.2 Lois continues 50 6.2.1 Loi normale 50 6.2.1.1 Définition 50 6.2.1.2 Propriétés 53 6.2.2 Loi du χ2 (chi-2) 53 6.2.2.1 Définition 54 6.2.2.2 Propriétés 54 6.2.3 Loi de Student 55 6.2.4 Loi exponentielle 57 Chapitre 7 : Statistiques descriptives 57 7.1 Rappels et compléments 58 7.2 Représentation complète d’une série d’expériences 58 7.2.1 Cas d’une variable qualitative 59 7.2.2 Cas d’une variable quantitative discrète 60 7.2.3 Cas d’une variable quantitative continue. Notion d’HISTOGRAMME 61 7.3 Représentation simplifiée d’une série d’expériences 61 7.3.1 Indicateurs de localisation des valeurs 61 7.3.2 Indicateurs de dispersion des valeurs 62 7.4 Reformulation de la moyenne et de la variance expérimentales Sommaire 2001 - 2002 Biostatistiques - Boisvieux, Golmard, Mallet & Morice 5/159 62 7.4.1 Reformulation de la moyenne expérimentale 63 7.4.2 Reformulation de la variance expérimentale 63 7.5 Cas particulier d’une variable à deux modalités - Proportion 64 7.5.1 Expression de la moyenne vraie de X 64 7.5.2 Expression de la variance vraie de X 64 7.5.3 Interprétation de la moyenne expérimentale 65 7.6 Conclusion : la variable aléatoire moyenne expérimentale 66 Résumé du chapitre 67 Chapitre 8 : Fluctuations de la moyenne expérimentale : la variable aléatoire moyenne expérimentale 67 8.1 Première propriété de la moyenne expérimentale 67 8.1.1 Un exemple 68 8.1.2 Généralisation 69 8.2 Seconde propriété de la moyenne expérimentale : le théorème central limite 70 8.3 Etude de la distribution normale (rappel) 72 8.4 Application du théorème central limite. Intervalle de Pari (I. P.) 72 8.4.1 Définition de l’intervalle de pari (I. P.) d’une moyenne expérimentale 74 8.4.2 Les facteurs de dépendance de la longueur de l’intervalle de pari (IP) 75 8.4.3 L’intervalle de pari d’une variable aléatoire 76 Résumé du chapitre 77 Chapitre 9 : Le premier problème d’induction statistique : les tests d’hypothèses. Principes 77 9.1 Un exemple concret (emprunté à Schwartz) 80 9.2 Principe général des tests d’hypothèses 80 9.2.1 Les étapes de mises en œuvre 82 9.2.2 Justification de la règle de décision. Choix de α 82 9.2.2.1 Interprétation de α 82 9.2.2.2 Effet d’un changement de valeur de α 83 9.2.3 Justification des conclusions du test. Puissance d’un test 86 9.2.4 Amélioration de l’interprétation du rejet de H0 86 9.2.4.1 Notion de degré de signification 87 9.2.4.2 Orientation du rejet 89 Résumé du chapitre 91 Chapitre 10 : Quelques tests usuels 91 10.1 Test d’égalité d’une proportion vraie à une valeur donnée (ou test de comparaison d’une proportion observée à une valeur donnée) 91 10.1.1 Mise en place du test 92 10.1.2 Autre interprétation du paramètre zc Sommaire 6/159 Biostatistiques - Boisvieux, Golmard, Mallet & Morice 2001 - 2002 93 10.2 Test d’égalité d’une moyenne vraie à une valeur donnée (ou test de comparaison d’une moyenne observée à une valeur donnée) 93 10.2.1 Cas des grands échantillons 94 10.2.2 Cas des petits échantillons (n < 30) 95 10.3 Test d’égalité de deux proportions vraies (ou test de comparaison de deux proportions observées) 97 10.4 Test d’égalité de deux moyennes vraies (ou test de comparaison de deux moyennes observées) 97 10.4.1 Cas des grands échantillons (nA et nB ≥ 30) 98 10.4.2 Cas des petits échantillons (nA ou nB < 30) 99 10.5 Test de comparaison de deux moyennes. Cas des séries appariées 101 Résumé du chapitre 103 Chapitre 11 : Tests concernant des variables qualitatives 103 11.1 Comparaison d’une répartition observée à une répartition donnée ou test du χ2 d’ajustement 104 11.1.1 Les étapes de mise en œuvre 107 11.1.2 Cas particulier : variable à deux modalités 109 11.2 Comparaison de deux répartitions observées ou test du χ2 d’homogénéité 112 11.3 Test d’indépendance entre deux variables qualitatives 116 Résumé du chapitre 117 Chapitre 12 : Liaison entre deux variables continues : notion de corrélation 117 12.1 Introduction 118 12.2 Abord du problème 120 12.3 Un indicateur de covariation : le coefficient de corrélation 124 12.4 Le coefficient de corrélation vrai 125 12.5 Mise à l’épreuve de la nullité du coefficient de corrélation vrai ρ 126 Résumé du chapitre 127 Chapitre 13 : A propos des tests d’hypothèses 127 13.1 Rappels et précisions 129 13.2 Jugement d’interprétation - La causalité 131 Chapitre 14 : Le second problème d’induction statistique : l’estimation - Intervalle de confiance 131 14.1 Introduction 132 14.2 Estimation ponctuelle 132 14.2.1 Définition Sommaire 2001 - 2002 Biostatistiques - Boisvieux, Golmard, Mallet & Morice 7/159 132 14.2.2 Propriétés 132 14.2.2.1 Biais 133 14.2.2.2 Variance 133 14.2.2.3 Erreur quadratique moyenne 133 14.2.3 Exemple 134 14.3 Intervalle de confiance 134 14.3.1 Exemple d’une proportion 136 14.3.2 Intervalle de confiance approché d’une proportion vraie 137 14.3.3 Intervalle de confiance approché d’une moyenne vraie (variable continue) 137 14.3.4 Applications 138 14.3.4.1 Précision d’un sondage 138 14.3.4.2 Précision d’une moyenne 141 Chapitre 15 : Evaluation de l’intérêt diagnostique des informations médicales 141 15.1 Introduction 141 15.1.1 Le diagnostic 142 15.1.2 Les informations médicales 142 15.1.3 Situation expérimentale et estimation 143 15.2 Les paramètres de l’évaluation 143 15.2.1 Un échantillon représentatif 143 15.2.1.1 Les données 143 15.2.1.2 Le couple sensibilité-spécificité 145 15.2.1.3 Les valeurs prédictives 145 15.2.1.4 Comparaison des deux couples de paramètres 146 15.2.2 Deux échantillons représentatifs 147 Chapitre 16 : Notion d’aide à la décision 147 16.1 Introduction 147 16.2 Notion d’utilité 148 16.3 Arbres de décision 148 16.3.1 Structure d’un arbre de décision 148 16.3.1.1 Les sommets 148 16.3.1.2 Les arcs 149 16.3.1.3 Les utilités 150 16.3.1.4 Les probabilités 150 16.3.2 Évaluation des arbres de décision 151 16.3.3 Intérêts et limites 153 Annexe A : Tables statistiques 154 A.1 TABLE DE LA VARIABLE NORMALE REDUITE u 155 A.2 TABLE DU t DE STUDENT Sommaire 8/159 Biostatistiques - Boisvieux, Golmard, Mallet & Morice 2001 - 2002 156 A.3 TABLE DE χ2 157 A.4 TABLE DU COEFFICIENT DE CORRELATION 159 Quelques références de livres couvrant le programme de biostatistiques de P1 Introduction 2001 - 2002 Biostatistiques - Boisvieux, Golmard, Mallet & Morice 9/159 Introduction Les statistiques constituent, en médecine, l’outil permettant de répondre à de nombreuses ques- tions qui se posent en permanence au médecin : 1. Quelle est la valeur normale d’une grandeur biologique, taille, poids, glycémie ? 2. Quelle est la fiabilité d’un examen complémentaire ? 3. Quel est le risque de complication d’un état pathologique, et quel est le risque d’un traitement ? 4. Le traitement A est-il plus efficace que le traitement B ? 1 La variabilité et l’incertain Toutes ces questions, proprement médicales, reflètent une propriété fondamentale des systèmes biologiques qui est leur variabilité. Cette variabilité est la somme d’une variabilité expérimentale (liée au protocole de mesure) et d’une variabilité proprement biologique. On peut ainsi décomposer la variabilité d’une grandeur mesurée en deux grandes composantes : variabilité totale = variabilité biologique + variabilité métrologique • La variabilité biologique peut être elle-même décomposée en deux termes : d’une part la va- riabilité intra-individuelle, qui fait que la même grandeur mesurée chez un sujet donné peut être soumise à des variations aléatoires ; et d’autre part la variabilité inter-individuelle qui uploads/s3/ cours-statistiques 1 .pdf

  • 43
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager