Cours d‘Analyse des Données Présenté par Monsieur CHEKARAOU IDI 1. Introduction

Cours d‘Analyse des Données Présenté par Monsieur CHEKARAOU IDI 1. Introduction L'analyse des données est une technique relativement ancienne 1930 (PEARSON, SPEARMAN, HOTELLING). Elle a connu cependant des développements récents 1960-1970 du fait de l'expansion de l'informatique. L'analyse des données est une technique d'analyse statistique d'ensemble de données. Elle cherche à décrire des tableaux et à en exhiber des relations pertinentes. Elle se distingue de l’analyse exploratoire des données. L'objectif de la démarche statistique est de faire apparaître ces liaisons. Les deux types de relations fondamentales sont les relations d'équivalence et les relations d'ordre. Ainsi, une population peut-elle être décomposée en classes hiérarchisées. 2. But Synthétiser, structurer l'information contenue dans des données multidimensionnelles (n individus, p variables). 3. ELÉMENTS FONDAMENTAUX 3.1. Méthodes Algèbre linéaire: les données sont vues de manière abstraites comme un nuage de points dans un espace vectoriel. On utilise – Des matrices qui permettent de manipuler un ensemble de variables comme un objet mathématique unique ; – Des valeurs et vecteurs propres qui permettent de décrire la structure d'une matrice. – Des métriques : permettent de définir la distance entre deux points de l'espace vectoriel ; on utilise aussi des produits scalaires. Théorie des probabilités nécessaire en statistique inferentielle (estimation, tests, modélisation et prévision,...). 3.2. rappels de géométrie : produit scalaire produit scalaire Le produit scalaire de deux vecteurs est le produit de la longueur de l'un par la projection de l'autre sur lui. (u.v.Cos(u,v)) Propriétés  Si les vecteurs sont orthogonaux le produit scalaire est nul.  Si les vecteurs sont colinéaires le produit scalaire est (u.v)  Si les vecteurs unitaires sont orthogonaux le produit scalaire est égal à la somme des produits des composantes correspondantes. 3.2. rappels de géométrie : projection projection La projection d'un vecteur sur un axe est obtenue par le produit scalaire du vecteur par le vecteur unitaire de l'axe. Cela permet le changement d’axe de coordonnées. 3.2. rappels de géométrie: Distance distance Dans l’espace des variables, un produit scalaire particulier, et donc une distance, s’impose. Le choix d’une distance est toujours arbitraire dans l’espace des individus, car il est possible d’associer à chaque variable un coefficient de pondération. 3.2. rappels de géométrie : Métrique: Métrique usuelle M = I correspond au produit scalaire usuel et Problèmes – la distance entre individus dépend de l'unité de mesure. – la distance privilégie les variables les plus dispersées. Métrique réduite c'est la plus courante ; on prend la matrice diagonale des inverses des variances p R Tr VD D Tr V D Tr I s s D M s V Tr I s s s g p s p j i g                         ) ( ) ( ) ( 1 0 0 1 ) ( 1 1 1 2 2 1 1 1 2 2 2  3.2. rappels de géométrie : Métrique et Tableau Transformé  Utiliser la métrique M = T’T sur le tableau X est équivalent a travailler avec la métrique classique I sur le tableau transforme XT’.  Tableau transformé Si on travaille sur le tableau transforme XT’ (changement de variables) au lieu de X, alors les nouveaux individus seront de la forme Tei et  Réciproque pour toute matrice symétrique positive M, il existe une matrice T (racine carrée de M) telle que et donc on peut ramener l'utilisation de la métrique a un changement de variables. T T M e e Me e Te T e Te Te Te Te M i i i i i i i i i i ' , ' ' ' ) ( )' ( , 2 1 2 1 2 1 2 1 2 1      3.3. Rappels: notation matricielle  Matrice tableau de données carre ou rectangulaire.  Vecteur matrice a une seule colonne.  Cas particuliers : matrice identité  Transposition de matrice échange des lignes et des colonnes d'une matrice ; on note M’ la transposée de M.                       1 1 1 1 ... 0 0 ... 1     I 3.3. La matrice des poids  Pourquoi utile quand les individus n'ont pas la même importance  Comment on associe aux individus un poids pi tel que et on représente ces poids dans la matrice diagonale de taille n  Cas uniforme tous les individus ont le même poids pi = 1 / n et D = I / n                  n n p p p D p p p ... 0 0 ... 1 ... 2 1 2 1    3.3. Point moyen et tableau centre Point moyen c'est le vecteur g des moyennes arithmétiques de chaque variable : ou On peut aussi écrire Tableau centré il est obtenu en centrant les variables autour de leur moyenne ou, en notation matricielle, X D I g X Y x x y D X g x p x x x g j j i j i n i j i i j p ) ' 11 ( ' 1 1 ' ) ... ( ' 1 1            3.3. Matrice de variance covariance Définition c'est une matrice carrée de dimension p ou skl est la covariance des variables xk et xl et s2 j est la variance de la variable xj Formule matricielle DY Y gg DX X V s s s s s s s V p p p p ' ' ' ... ... 1 2 2 1 2 1 2 1 1 1                      3.3. Matrice de corrélation Définition Si l'on note Formule matricielle                                       p s s s p p l k kl kl s s s D VD D R s r r r R s s s r 1 0 1 0 1 1 1 1 2 1 1 1 1 1 1 2 1 2 1         3.3. rappels sur les matrices Trace La trace d'une matrice est la somme des termes de la diagonale principale. Valeur propre est valeur propre de A <=> Det(A - I) = 0 Vecteur propre V est vecteur propre de f si f(V) = V 3.3. rappels sur les matrices matrice diagonale Une matrice diagonale est une matrice dont tous les termes appartiennent à la diagonale principale. 3.3. Valeurs et vecteurs propres  Définition un vecteur v de taille p est un vecteur propre d'une matrice A de taille p x p s'il existe λ Є C telle que est une valeur propre de A associée à v.  Domaine En général, les vecteurs propres et valeurs propres sont complexes; dans tous les cas qui nous intéressent, ils seront réels.  Interprétation des vecteurs propres ce sont les directions dans lesquelles la matrice agit.  Interprétation des valeurs propres c'est le facteur multiplicatif associe a une direction donnée. v Av   3.3. Exemple: valeurs et vecteurs propres La matrice a pour vecteurs propres On vérifie facilement que les valeurs propres associées sont 6 4 2 0 1 1 1 0 1 1 1 0 3 1 1 2 4 2 1 1 5 3 2 1 3 2 1                                                     v v v 3.3. Cas particuliers: Valeurs et vecteurs propres  Matrice nulle sa seule valeur propre est 0, et tout vecteur est vecteur propre.  Matrice identité tout vecteur est vecteur propre de I avec valeur propre 1, puisque Iv = v.  Matrice diagonale si Dλ est une matrice diagonale avec les coefficients λ1,λ2,… λp, alors le i-eme vecteur coordonnée est vecteur propre de Dλ associe a la valeur propre λ i. L'action d'une matrice diagonale est de multiplier chacune des coordonnées d'un vecteur par la valeur propre correspondante.  Matrice diagonalisable c'est une matrice dont les vecteurs propres forment une base de l'espace vectoriel : tout vecteur peut être représenté de manière unique comme combinaison linéaire des vecteurs propres. Une matrice de taille p x p qui a p valeurs propres réelles distinctes est diagonalisable dans R. 3.3. uploads/Management/ ing-3-analyses-des-donnees.pdf

  • 50
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager
  • Détails
  • Publié le Mar 19, 2022
  • Catégorie Management
  • Langue French
  • Taille du fichier 0.4508MB