i DOCUMENT DE COURS Année académique : 2020-2021 Niveau : M1 Niveau : MRGE2 Ann

i DOCUMENT DE COURS Année académique : 2020-2021 Niveau : M1 Niveau : MRGE2 Année Académique : 2019-2020 Dr. Chrissy Garel Makouanzi Ekomono Maître-assistant CAMES, ENSAF, Université Marien NGOUABI Directeur Scientifique de l’Institut national de Recherche Forestière (IRF) garelmak@yahoo.fr Garel Makouanzi Université MARIEN NGOUABI Ecole Nationale Supérieure d’Agronomie et de Foresterie (ENSAF) Biostatistique ii Table des matières Avant-propos ........................................................................................................................................... iv CHAPITRE I : INTRODUCTION A LA BIOSTATISTIQUE ............................................................................... 1 1-1- Définition ................................................................................................................................. 1 1-2- La terminologie en biostatistique ............................................................................................ 1 1-2-1- La population ........................................................................................................................ 1 1-2-2- L’échantillon .......................................................................................................................... 2 1-2-3- L’inférence statistique .......................................................................................................... 2 1-2-4- La variable ............................................................................................................................. 2 1-2-5- Le facteur .............................................................................................................................. 3 1-2-6- Les variantes, niveaux et modalités d’un facteur ................................................................. 3 1-2-7- Le traitement ou l’objet ........................................................................................................ 4 1-2-8- Le témoin ou l’objet de référence ........................................................................................ 4 1-2-9- L’unité expérimentale ........................................................................................................... 4 CHAPITRE II : L’EXPERIMENTATION STATISTIQUE ................................................................................... 6 2-1- La conception et l’organisation de l’expérimentation ................................................................. 6 2-2- Les dispositifs expérimentaux ...................................................................................................... 7 2-3- L’interprétation expérimentale .................................................................................................. 12 CHAPITRE III : LA STATISTIQUE DESCRIPTIVE ......................................................................................... 13 3-1- Les représentations graphiques ................................................................................................. 13 3-1-1- Le diagramme en bâtons – Le camembert – Le diagramme en barres .............................. 13 3-1-2- L’histogramme, le polygone et la courbe de fréquences ................................................... 15 3-1-3- La fonction de répartition empirique (diagramme cumulatif ou Courbe cumulative) ....... 16 3-1-4- Les caractéristiques des distributions (mesures de forme et loi de probabilité) ............... 17 3-2- Les indicateurs numériques ....................................................................................................... 19 3-2-1- Les indicateurs de position ................................................................................................. 19 3-2-2- Les indicateurs de dispersion .............................................................................................. 22 3-3- L’Intervalle de confiance ............................................................................................................ 24 3-4- Le Box plot (la boîte à moustaches) ........................................................................................... 25 3-5- Les Corrélations .......................................................................................................................... 26 3-5-1- La corrélation et la causalité ............................................................................................... 27 3-5-2- Les Corrélations non linéaires ............................................................................................. 27 CHAPITRE IV : LES TESTS STATTISTIQUES .............................................................................................. 28 4-1- Introduction aux tests statistiques ............................................................................................ 28 iii 4-1-1- Les tests paramétriques et non paramétriques.................................................................. 28 4-1-2- La mise en œuvre d’un test statistique .............................................................................. 28 4-2- L’analyse de variance ............................................................................................................. 29 4-2-1- Les conditions d’application de l’analyse de variance ........................................................ 32 4-2-2- Les transformations des données ....................................................................................... 33 4-2-3- Les tests post hoc ou tests à postériori .............................................................................. 34 4-3- La comparaison de deux moyennes (Test t-Student) ................................................................ 35 4-3-1- Echantillons indépendants .................................................................................................. 35 4-3-2- Echantillons appariés .......................................................................................................... 35 4-4- Les tests de Kruskal-Wallis et de Steel-Dwass ........................................................................... 36 4-4-1- Le test de Kruskal-Wallis ..................................................................................................... 36 4-4-2- Le test de steel-Dwass ........................................................................................................ 37 4-5- Le test d’indépendance du χ² de deux variables qualitatives .................................................... 38 4-6- Les tests de comparaison des proportions ................................................................................ 39 4-6-1- La comparaison d’une proportion à une référence ............................................................ 39 4-6-2- La comparaison de deux proportions ................................................................................. 40 CHAPITRE V : LA STATISTIQUE MULTIDIMENTIONNELLE ...................................................................... 41 5-1- Introduction ............................................................................................................................... 41 5-2- L’Analyse en composante principales ........................................................................................ 41 5-3- L’Analyse Factorielle des Correspondances ............................................................................... 46 5-4- La classification ascendante hiérarchique ................................................................................. 46 5-5- L’Analyse de Hill et Smith ........................................................................................................... 47 CHAPITRE VI : LA MODELISATION STATISTIQUE .................................................................................... 49 6-1 – Introduction à la modélisation biostatistique .......................................................................... 49 6-2- La régression linéaire ................................................................................................................. 49 6-2-1 – La représentation graphique ................................................................................................. 49 6-2-2 – Le modèle général de régression .......................................................................................... 50 6-2-3 – L’estimation des paramètres du modèle de régression ....................................................... 51 6-3- La régression non linéaire .......................................................................................................... 52 6-4- L’analyse de covariance ............................................................................................................. 52 6-5- Le modèle linéaire mixte ............................................................................................................ 56 BIBLIOGRAPHIE ...................................................................................................................................... 57 iv Avant-propos Ce module de Biostatistique est destiné aux étudiants de première année de Master des parcours SA (Sciences Agronomiques), STF (Sciences et Techniques Forestières), PV (Production Végétale) et PSA (Production et Santé Animale) de l’Ecole Nationale Supérieure d’Agronomie et de Foresterie (ENSAF) de l’Université Marien Ngouabi. Il présente la terminologie en biostatistique et traite de l’expérimentation statistique. Ensuite les indicateurs de description (graphiques et numériques) des données sont abordées, avant l’apprentissage de l’utilisation des tests statistiques et de la régression linéaire simple. Enfin ce cours se termine par la présentation des différentes méthodes de la statistique multidimensionnelle. À la fin de ce module, l’étudiant doit :  maitriser la terminologie de base en biostatistique ;  comprendre les bases de l’expérimentation biostatistique ;  comprendre l'utilité de la statistique descriptive lors de toute analyse préliminaire des données ;  savoir explorer les données graphiquement pour les caractériser, identifier les problèmes et les tendances ;  savoir utiliser les statistiques descriptives pour résumer adéquatement des données ;  savoir identifier et mettre en œuvre le test statistique approprié à l’objectif d’une étude ;  savoir réaliser des analyses statistiques ;  savoir interpréter les résultats avec fiabilité. 1 CHAPITRE I : INTRODUCTION A LA BIOSTATISTIQUE 1-1- Définition L’analyse des données est utilisée pour décrire les phénomènes étudiés, faire des prévisions et prendre des décisions à leur sujet. En cela, la statistique est un outil essentiel pour la compréhension et la gestion des phénomènes complexes. Les données étudiées peuvent être de toute nature, ce qui rend la statistique utile dans tous les champs disciplinaires, de l’économie à la biologie en passant par les sciences humaines, et bien sûr les sciences de l’ingénieur. La biostatistique ou biométrie est l’application des concepts et principes statistiques à des données biologiques. Les expériences en biologie génèrent des quantités pharamineuses de données qu’il faille synthétiser. La biostatistique regroupe un ensemble de méthodes qui visent : la collecte des données, le traitement des données, l’analyse des données et l’interprétation des données. Une interprétation incorrecte d’observations, peut conduire à des conclusions tout à fait erronées. Les méthodes statistiques permettent d’éprouver la validité des résultats avec la plus grande rigueur scientifique. Autrement dit la biostatistique aide au raisonnement en se basant sur un formalisme éprouvé. On appelle statistique descriptive l’ensemble des méthodes et techniques mathématiques permettant de représenter, de décrire et de résumer un ensemble de données. On appelle statistique inférentielle (ou inductive) l’ensemble des méthodes visant à modéliser un ensemble de données afin de tirer des conclusions sur un ensemble plus vaste. La statistique repose sur des modèles et des hypothèses issues des probabilités. Statistiques et probabilités sont deux aspects complémentaires de l’étude des phénomènes aléatoires. 1-2- La terminologie en biostatistique 1-2-1- La population La population correspond à l’ensemble des individus (éléments) sur lequel on aimerait que les conclusions d’une étude portent. C’est l’ensemble des éléments qui composent la population cible, caractérisés par au moins une caractéristique. 2 1-2-2- L’échantillon En général, la population est trop grande pour qu’on puisse l’observer en entier, on fait recours alors à un échantillon (sample), qui est un sous ensemble de la population. C’est la fraction de la population statistique sur laquelle des mesures sont faites pour connaitre les propriétés de cette population. L’échantillon est identifié par son effectif, noté n. Si l’échantillon est constitué de tous les individus de la population, on parle de recensement. Il est extrêmement rare que l’on se trouve dans cette situation, essentiellement pour des raisons de coût L’échantillonnage est le mécanisme de génération de l’échantillon. L’échantillonnage peut être de deux types : - L’échantillonnage aléatoire, au sein duquel on prélève au hasard et de façon indépendante un certain nombre n d’éléments de la population statistique à N éléments. Chaque élément de la population a la même probabilité d’être sélectionné. - L’échantillonnage représentatif, reflétant fidèlement la composition de la population. L’inventaire exhaustif ou recensement est un moyen qui permet d’obtenir un échantillon représentatif d’une population. 1-2-3- L’inférence statistique L’inférence statistique est une extrapolation des résultats observés sur un échantillon à la population cible. Autrement dit, à partir d’un nombre réduit d’observations, on répond à des hypothèses faites sur une population plus large avec un niveau de fiabilité donné. 1-2-4- La variable La variable est une caractéristique mesurable ou observable sur tous les éléments d’une population ou d’un échantillon. Autrement dit, la variable est la grandeur statistique que l’on ET ANALYSES 3 souhaite étudier. On distingue deux types de variables : les variables quantitatives et les variables qualitatives. Les modalités d’une variable quantitative expriment des quantités numériques. Une variable quantitative peut être continue (peut prendre, en théorie, une infinité des valeurs, formant un ensemble continu) ou discrète (ne peut prendre que des valeurs entières). Les modalités d’une variable qualitative n’expriment pas des quantités numériques. Une variable qualitative peut être catégorielle, autrement dit nominale (les modalités ne sont pas hiérarchisées); ordinale (les modalités sont hiérarchisées) ou binaire (présence/absence). 1-2-5- Le facteur On appelle facteur toute série d’éléments de même nature pouvant être comparés au cours d’une expérimentation. Exemple : une série de variétés, une série d’essences forestières, un ensemble de produits phytosanitaires, différentes rations alimentaires, etc. Les facteurs peuvent être classés en : - facteur qualitatif, caractérisé par des éléments qui ne peuvent être classés à priori (exemples : une série de variétés, un ensemble de fongicides, …); - facteur quantitatif, dont les éléments se classent de façon logique à priori (exemples : doses d’un engrais, températures, …). On distingue des facteurs étudiés et des facteurs aléatoires. Les facteurs étudiés sont ceux introduits volontairement dans l’expérience (variétés, doses de fertilisation, …). Les facteurs aléatoires ce dit des facteurs inhérents au milieu. Ceux-ci peuvent être contrôlés lorsque le dispositif expérimental uploads/Management/ cours-biostatistique-m1-ensaf-2020-2021.pdf

  • 34
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager
  • Détails
  • Publié le Sep 08, 2022
  • Catégorie Management
  • Langue French
  • Taille du fichier 2.5919MB