Données - Exemples Etude des individus Etude des variables Aides à l’interpréta
Données - Exemples Etude des individus Etude des variables Aides à l’interprétation Analyse en Composantes Principales (ACP) 1 Données - Exemples 2 Etude des individus 3 Etude des variables 4 Aides à l’interprétation 2/35 Données - Exemples Etude des individus Etude des variables Aides à l’interprétation Quel type de données ? L’ACP s’intéresse à des tableaux de données rectangulaires avec des individus en lignes et des variables quantitatives en colonnes Pour la variable k, on note : la moyenne : xk =1 I v u ∑ xik i =1 l’écart-type : sk = Figure: Tableau de données en ACP u √1 I ∑ (xik − xk )2 i =1 3/35 Données - Exemples Etude des individus Etude des variables Aides à l’interprétation Exemples • Analyse sensorielle : note du descripteur k pour le produit i • Ecologie : concentration du polluant k dans la rivière i • Economie : valeur de l’indicateur k pour l’année i • Génétique : expression du gène k pour le patient i • Biologie : mesure k pour l’animal i • Marketing : valeur d’indice de satisfaction k pour la marque i • Sociologie : temps passé à l’activité k par les individus de la CSP i • etc. ⇒Il existe de très nombreux tableaux comme cela 4/35 • Géomatique : nombre de la population k dans l’zone i Données - Exemples Etude des individus Etude des variables Aides à l’interprétation Janv Févr Mars Avri Mai Juin juil Août Sept Octo Nove Déce Lati Long Bordeaux 5.6 6.6 10.3 12.8 15.8 19.3 20.9 21 18.6 13.8 9.1 6.2 44.5 -0.34 Brest 6.1 5.8 7.8 9.2 11.6 14.4 15.6 16 14.7 12 9 7 48.24 -4.29 Clermont 2.6 3.7 7.5 10.3 13.8 17.3 19.4 19.1 16.2 11.2 6.6 3.6 45.47 3.05 Grenoble 1.5 3.2 7.7 10.6 14.5 17.8 20.1 19.5 16.7 11.4 6.5 2.3 45.1 5.43 Lille 2.4 2.9 6 8.9 12.4 15.3 17.1 17.1 14.7 10.4 6.1 3.5 50.38 3.04 Lyon 2.1 3.3 7.7 10.9 14.9 18.5 20.7 20.1 16.9 11.4 6.7 3.1 45.45 4.51 Marseille 5.5 6.6 10 13 16.8 20.8 23.3 22.8 19.9 15 10.2 6.9 43.18 5.24 Montpellier 5.6 6.7 9.9 12.8 16.2 20.1 22.7 22.3 19.3 14.6 10 6.5 43.36 3.53 Nantes 5 5.3 8.4 10.8 13.9 17.2 18.8 18.6 16.4 12.2 8.2 5.5 47.13 -1.33 Nice 7.5 8.5 10.8 13.3 16.7 20.1 22.7 22.5 20.3 16 11.5 8.2 43.42 7.15 Paris 3.4 4.1 7.6 10.7 14.3 17.5 19.1 18.7 16 11.4 7.1 4.3 48.52 2.2 Rennes 4.8 5.3 7.9 10.1 13.1 16.2 17.9 17.8 15.7 11.6 7.8 5.4 48.05 -1.41 Strasbourg 0.4 1.5 5.6 9.8 14 17.2 19 18.3 15.1 9.5 4.9 1.3 48.35 7.45 Toulouse 4.7 5.6 9.2 11.6 14.9 18.7 20.9 20.9 18.3 13.3 8.6 5.5 43.36 1.26 Vichy 2.4 3.4 7.1 9.9 13.6 17.1 19.3 18.8 16 11 6.6 3.4 46.08 3.26 5/35 Données - Exemples Etude des individus Etude des variables Aides à l’interprétation Problèmes - objectifs Le tableau peut être vu comme un ensemble de lignes ou un ensemble de colonnes Etude des individus • Quand dit-on que 2 individus se ressemblent du point de vue de l’ensemble des variables ? • Si beaucoup d’individus, peut-on faire un bilan des ressemblances ? ⇒construction de groupes d’individus, partition des individus 6/35 Données - Exemples Etude des individus Etude des variables Aides à l’interprétation Problèmes - objectifs Etude des variables • Recherche des ressemblances entre variables • Entre variables, on parle plutôt de liaisons • Liaisons linéaires sont simples, très fréquentes et résument de nombreuses liaisons ⇒coefficient de corrélation ⇒visualisation de la matrice des corrélations ⇒recherche d’un petit nombre d’indicateurs synthétiques pour résumer beaucoup de variables (ex. d’indicateur synthétique a priori : la moyenne, mais ici on recherche des indicateurs synthétiques a posteriori, à partir des données) 7/35 Données - Exemples Etude des individus Etude des variables Aides à l’interprétation Problèmes - objectifs Lien entre les deux études • Caractérisation des classes d’individus par les variables ⇒besoin de procédure automatique • Individus spécifiques pour comprendre les liaisons entre variables ⇒utilisation d’individus extrêmes (en terme de variables : langage abstrait mais puissant, revenir aux individus pour voir les choses plus simplement) Objectifs de l’ACP : • Descriptif - exploratoire : visualisation de données par graphiques simples • Synthèse - résumé de grands tableaux individus × variables 8/35 Données - Exemples Etude des individus Etude des variables Aides à l’interprétation Etude des individus Etude des variables 1 k K 1 k K 1 1 i X i X I I RK RI var 1 ind 1 var k ind i 9/35 Données - Exemples Etude des individus Etude des variables Aides à l’interprétation Analyse en Composantes Principales (ACP) 1 Données - Exemples 2 Etude des individus 3 Etude des variables 4 Aides à l’interprétation 10 / 35 Données - Exemples Etude des individus Etude des variables Aides à l’interprétation Le nuage des individusN’ 1 individu = 1 ligne du tableau ⇒1 point dans un espace à K dim • Si K = 1 : Représentation axiale • Si K = 2 : Nuage de points • Si K = 3 : Représentation + difficile en 3D • Si K = 4 : Impossible à représenter MAIS le concept est simple Notion de ressemblance : distance (au carré) entre individus i et i′ : d2(i,i′) = ∑ (xik − xi′k )2 (merci Pythagore) k=1 Etude des individus ≡ Etude de la forme du nuage N’ 11 / 35 Données - Exemples Etude des individus Etude des variables Aides à l’interprétation Le nuage des individus NI • Etudier la structure, i.e. la forme du nuage des individus • Les individus vivent dans RK 12 / 35 Données - Exemples Etude des individus Etude des variables Aides à l’interprétation Centrage - réduction des données • Centrer les données ne modifie pas la forme du nuage ⇒toujours centrer + + + + ++ + + + + ++ + ++ + + ++ + + ++ ++ + + + + + + + + ++ + ++++++++++++++++ + ++ + + + + + + + ++++++ +++ + + + + ++ + + + + ++ + + + + + + + + + + + + + + + + + + + 55 60 65 70 75 80 85 50 55 60 65 70 75 80 85 −20 −10 0 10 20 poids (en kg) poids (en kg) poids (en quintal) • Réduire les données est indispensable si les unités de mesure sont différentes d’une variable à l’autre xik ↪→xik −xk sk 13 / 35 Taille (en cm) Taille (en m) Taille (en m) Janv Févr Mars Avri Mai Juin juil Août Sept Octo Nove Déce Bordeaux 0.84 0.98 1.40 1.33 0.94 0.85 0.52 0.74 0.90 0.84 0.67 0.72 Brest 1.10 0.54 -0.29 -1.30 -1.95 -1.98 -2.06 -1.83 -1.28 -0.18 0.62 1.14 Clermont -0.71 -0.63 -0.50 -0.50 -0.44 -0.31 -0.21 -0.24 -0.44 -0.63 -0.76 -0.66 Grenoble -1.28 -0.90 -0.36 -0.28 0.05 -0.02 0.13 -0.03 -0.16 -0.52 -0.82 -1.35 Lille -0.81 -1.07 -1.51 -1.52 -1.40 -1.46 -1.33 -1.27 -1.28 -1.09 -1.05 -0.71 Lyon -0.97 -0.85 -0.36 -0.06 0.32 0.38 0.42 0.27 -0.05 -0.52 -0.70 -0.92 Marseille 0.79 0.98 1.20 1.48 1.63 1.71 1.69 1.66 1.63 1.52 1.30 1.09 Montpellier 0.84 1.03 1.13 1.33 1.22 1.31 1.39 1.41 1.30 1.29 1.19 0.87 Nantes 0.53 0.26 0.11 -0.13 -0.37 -0.37 -0.50 -0.50 -0.33 -0.07 0.16 0.35 Nice 1.82 2.03 1.74 1.70 1.56 1.31 1.39 1.51 1.86 2.08 2.05 1.77 Paris -0.30 -0.41 -0.43 -0.20 -0.09 -0.19 -0.36 -0.45 -0.55 -0.52 -0.47 -0.29 Rennes 0.43 0.26 -0.23 -0.64 -0.92 -0.94 -0.94 -0.91 -0.72 -0.41 -0.07 0.29 Strasbourg -1.84 -1.85 -1.78 -0.86 -0.30 -0.37 -0.41 -0.65 -1.06 -1.60 -1.74 -1.87 Toulouse 0.37 0.42 0.65 0.45 0.32 0.50 0.52 0.69 0.74 0.55 0.39 0.35 Vichy -0.81 -0.79 -0.77 -0.79 -0.57 -0.42 -0.26 -0.39 -0.55 -0.75 -0.76 -0.76 ACP ≡ Analyse du tableau centré-réduit Difficile de voir le nuage N’ ⇒on essaie d’en avoir une image approchée 14 / 35 Données - Exemples Etude des individus Etude des variables Aides à l’interprétation Ajustement du nuage des individus L’ACP vise à fournir une image simplifiée de N’ la + fidèle possible ⇐⇒Trouver le sous-espace qui résume au mieux les données Qualité d’une image : • Restitue fidèlement la forme générale du nuage (animation) 14 / 35 Données - Exemples Etude des individus Etude des variables Aides à l’interprétation Ajustement du nuage des individus L’ACP vise à fournir une image simplifiée de N’ la + fidèle possible ⇐⇒Trouver le sous-espace qui résume au mieux les données Qualité d’une image : • Restitue fidèlement la forme générale du nuage (animation) • Meilleure représentation de la diversité, de la variabilité • Ne perturbe pas les distances entre individus Comment quantifier la qualité d’une image ? A l’aide de la notion de dispersion ou variabilité appelée Inertie Inertie ≡ variance généralisée à plusieurs dimensions 15 / 35 Données - Exemples Etude des individus Etude des variables Aides à l’interprétation uploads/Management/acp-cours.pdf
Documents similaires










-
29
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Jan 15, 2022
- Catégorie Management
- Langue French
- Taille du fichier 1.0161MB