Année Universitaire 2008-2009 Régression sur variables catégorielles Laurent Ro

Année Universitaire 2008-2009 Régression sur variables catégorielles Laurent Rouvière Université Rennes 2 Place du Recteur H. le Moal CS 24307 - 35043 Rennes Tel : 02 99 14 18 21 Mel : laurent.rouviere@univ-rennes2.fr Table des matières 1 Introduction 5 1.1 Rappels sur le modèle linéaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 1.2 Le modèle linéaire généralisé : GLM . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 1.2.1 La régression logistique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 1.2.2 La régression log-linéaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 1.2.3 Généralisation : GLM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 1.3 Exemples de fonctions de liens pour la régression d’une variable binaire . . . . . . . 12 2 Analyse discriminante logistique 15 2.1 Estimation des paramètres . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 2.1.1 Equations du score . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 2.1.2 Rappel sur l’algorithme de Newton-Raphson . . . . . . . . . . . . . . . . . . 18 2.1.3 Calcul des estimateurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 2.2 Dimensions explicatives, variables explicatives . . . . . . . . . . . . . . . . . . . . . 19 2.2.1 Variable explicative continue . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 2.2.2 Variable explicative qualitative . . . . . . . . . . . . . . . . . . . . . . . . . 19 2.2.3 Interactions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 2.3 Interprétation des coefficients β . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 2.4 Précision des estimations et tests . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 2.4.1 Loi asymptotique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 2.4.2 Intervalles de confiance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 2.4.3 Tests de nullité de q coefficients libres . . . . . . . . . . . . . . . . . . . . . . 24 2.5 Un exemple avec R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 2.5.1 Modèles “simples” . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 2.5.2 Encore d’autres modèles... . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 3 Sélection et validation de modèles 31 3.1 Sélection ou choix de modèle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 3.1.1 Un outil spécifique : la déviance . . . . . . . . . . . . . . . . . . . . . . . . . 31 3.1.2 Test de déviance entre 2 modèles emboîtés . . . . . . . . . . . . . . . . . . . 34 3.1.3 Critère de choix de modèles . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 3.1.4 Apprentissage/validation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 3.1.5 Validation croisée . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 3.1.6 Sélection automatique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 3.2 Validation du modèle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 3.2.1 Test d’adéquation par la déviance . . . . . . . . . . . . . . . . . . . . . . . . 42 3.2.2 Test d’Hosmer Lemeshow . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 3.2.3 Analyse des résidus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 Régression sur variables catégorielles Laurent Rouvière 4 Table des matières 3.2.4 Points leviers et points influents . . . . . . . . . . . . . . . . . . . . . . . . . 47 4 Modèle logistique multi-classes 51 4.1 Modèle polytomique ordonné . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 4.1.1 Cas binaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 4.1.2 Généralisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 4.1.3 L’égalité des pentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54 4.2 Modèle multinomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 4.2.1 Le modèle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 4.2.2 Estimation et interprétation des paramètres . . . . . . . . . . . . . . . . . . 56 Annexes 59 A.1 Rappels sur la méthode du maximum de vraisemblance . . . . . . . . . . . . . . uploads/Litterature/ poly-freg-var-quali.pdf

  • 29
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager