Analyse de données Plan du cours - Les méthodes de traitement des données - Les

Analyse de données Plan du cours - Les méthodes de traitement des données - Les traitements élémentaires - Les analyses multi-variées - Les méthodes avancées d'analyse multi-variée En colonne : les variables En ligne : les répondants - Les critères fondamentaux de classement des méthodes d'analyse de données - Critère 1 : la partition ou non de la matrice des données - critère 2 : La nature des variables impliquées (nominales, ordinales ou métriques) - Critère 3 : Le nombre de variables traitées simultanément (méthodes uni- variées, variées et multi-variées) - Critère 1 : la partition ou non de la matrice des données - Sépare les méthodes "descriptives" des méthodes "explicatives" - Traduit l'objectif de l'utilisateur : - Logique de modélisation (étude de liaison entre deux phénomènes) - Logique de description (résumer les données d'un phénomène) - Critère 2 : La nature des variables impliquées (nominales, ordinales ou métriques) - Les variables métriques (quantitatives) => apparaissent chaque fois que la personne interrogée se voit demander la valeur qu'elle donne à la variable concernée - Les variables nominales (qualitatives) : =>apparaissent chaque fois que la personne interrogée a le choix entre plusieurs modalités qui lui sont proposées explicitement ou implicitement (cas d'une question ouverte avec post- codification) - Les variables ordinales (qualitatives) => apparaissent chaque fois que la personne interrogée se voit demandée de classer plusieurs items proposés - Critère 3 : Le nombre de variables traitées simultanément (méthodes uni-variées, variées et multi-variées) - L'analyse uni-variée : => Consiste à examiner la distribution des modalités de réponse pour une variable, càd une colonne de la matrice des données => permet de décrire l'échantillon (comptage des effectifs de chaque modalité de chaque variable) - L'analyse bi-variée => Consiste à étudier les relations entre deux variables (càd deux colonnes dans la matrice des données) => permet d'explorer les relations entre variables prises deux à deux - L'analyse multi-variée : elle a été développée pour permettre le traitement simultané de de plusieurs variables. Les traitements élémentaires Les analyses univariées (ou tris à plat) - concernent le traitement d’une seule variable - ont pour objet de synthétiser et d’analyser les informations disponible sur cette variable. Les analyses bivariées (ou tris croisés) - ont pour objet de mettre en évidence les relations éventuelles qui existent entre deux variables analysées simultanément. Les analyses multivariées Les méthodes explicatives - cherchent à étudier les relations entre deux groupes de variables. - l’une d’entre elles mesure un phénomène que l’on cherche à expliquer. - Les autres représentent des phénomènes qui sont supposés influencer et déterminer le précédent. Y = aX + b (Y : endogène, dépendant X : Exo, Indép) Les méthodes descriptives - prennent en compte un ensemble de variables - cherchent à structurer ou résumer ou résumer un groupe de variables - cherchent à décrire de façon synthétique la structure des données disponibles. Les méthodes explicatives - La régression linéaire * o Simple : explication d’une variable quantitative Y à l’aide d’une variable également quantitative X o Multiple : utilisation de plusieurs variables explicatives (X1, X2,…) pour expliquer Y . - L’analyse de la variance (ANOVA)* - L’analyse discriminante - L’analyse conjointe (MONANOVA) - La segmentation Les méthodes descriptives - L’analyse en composantes principales (ACP)* - L’analyse typologique - L’analyse factorielle des correspondances Les méthodes avancées d’analyse multivariée L ’analyse canonique - étend la régression au cas ou il y a plusieurs variables à expliquer - peut être considérée comme la plus générale des méthodes fondées sur le modèle linéaire Les modèles de causalité - constituent le stade actuellement le plus avancé des méthodes d’analyse de données. Référence bibliographique : MARKET : Etudes et Recherches en Marketing Auteur : Y .Evrard, B. Pras et E.roux Les enquêtes par questionnaire avec Sphinx Auteur : Stéphane Ganassali Editeur : Pearson Education Date de parution : 2007 Volume : 247 pages Etudes marketing avec SPSS Auteurs : Naresh K. Malhotra (Auteur), Jean-Marc Décaudin & Afifa Bouguerra (T raduction) Editeur : Pearson Education Date de parution : 2004 (4ème édition) Volume : 682 pages Etudes de marché Auteurs : Jean-Luc Giannelloni & Eric Vernette Editeur : Vuibert Date de parution : 2001 (2ème édition) Volume : 592 Le traitement des données en marketing Auteur : Jean-Pierre Vedrine Editeur : les Editions d’Organisation Date de parution : 1991 Partie 1 : Les traitements élémentaires Chapitre I : Les analyses univariées Introduction : - Les analyses univariées concernent le traitement d’une seule variable. - Elles ont pour objet de synthétiser et d’analyser les informations disponibles sur cette variable. - Ces données peuvent provenir de sources différentes : o Données d’observations o Données expérimentales o Séries statistiques o Résultats d’une question posée dans le cadre d’un sondage Exemple : - Le nombre d’entrées dans un hypermarché à différentes heures de la journée - Les ventes d’un produit associées à un conditionnement expérimental - L’évolution des ventes d’un produit sur un certain nombre d’années - Les réponses à la question : « possédez-vous un autoradio ? » Données quantitatives (métriques) - Dans le cadre d’un questionnaire, elles apparaissent à chaque fois que la personne interrogée se voit demander la valeur qu’elle donne à la variable concernée. - Pour chaque individu i, une valeur Xi sera obtenue pour cette variable. Si l’enquête porte sur n individus la variable sera associée à un vecteur de n éléments. - La synthétisation de ces données peut être réalisée à travers le calcul de divers indicateurs que fournissent la plupart des logiciels. Données qualitatives (nominales) - Dans le cadre d’un questionnaire, elles apparaissent chaque fois que la personne interrogée a le choix entre plusieurs modalités qui lui sont proposées explicitement ou implicitement (cas d’une question ouverte avec post-codification) - Pour chaque individu, la réponse correspond à un code ou éventuellement à plusieurs si le choix est multiple. - Sur l’ensemble de la population enquêtée, on calcule alors la fréquence absolue (le nombre de fois qu’un code donné est apparu pour la variable étudiée) Données qualitatives (ordinales) - Dans le cadre d’un questionnaire, elles apparaissent chaque fois que la personne interrogée se voit demander de classer plusieurs items proposés. - Sur l’ensemble de la population enquêtée, il sera ainsi possible de comptabiliser : o Le nombre de fois qu’un item donné a été classé en 1ère position, en 2ème … en mn o Le nombre de fois qu’un item donné a été classé avant un autre item ; de ce type de résultats permettra d’établir une matrice des préférences. Les indicateurs de position : cherchent à résumer par une caractéristique de tendance centrale les niveaux pris par une variable. - Le mode : Modalité pour laquelle les observations sont les plus nombreuses (Mo) - La médiane : Valeur qui divise la population étudiée en deux parties égales (Me) - La moyenne : Généralement considérée comme représentant « naturellement » la tendance centrale de la distribution d’une variable numérique. XAk = £Xik/n Les indicateurs de position : mesurent la plus ou moins grande dispersion des valeurs autour de leur tendance centrale. - L’étendue : Intervalle qui sépare les deux valeurs extrêmes : E = Xmax - Xmin - La variance : Moyenne des carrés des écarts par rapport à la moyenne (obtenue sur échantillon) : S²k = £(Xik – Xak)²/(n-1) - L’écart-type : Racine carrée de la variance. - Le coefficient de variation : Pourcentage permettant de comparer la dispersion de variables ayant des moyennes différentes. Le test de moyenne Il s’agit de comparer la moyenne obtenue sur un échantillon A XA à une valeur prédéterminée. L’hypothèse nulle peut être formulée de deux façons : - Sous forme d’inégalité (par exemple XA ???) Il s’agira alors d’un test unilatéral. - Sous forme d’égalité (XA ???) : Il s’agira alors d’un test bilatéral. Deux tests sont utilisables (z ou t) selon deux conditions : - Connait-on ou non l’écart-type de la variable dans la population ( ??) ? si oui on utilisera le test Z - Sinon (ce qui est le cas le plus fréquent dans la pratique), on utilisera l’écart-type de l’échantillon ( ??) comme estimateur de l’écart-type (inconnu) de la population le choix dépend alors de la taille de l’échantillon : si ???? on utilisera le test (sinon on utilisera le test z) Le test z consiste alors à calculer la valeur z = ???? où l’écart-type de la moyenne ???? La valeur observée de z est comparée à la valeur z correspondant au seuil de signification ?? retenu ?? suit une distribution normale, c’est donc sur une table de cette distribution que l’on trouvera ??. Su l’on désire travailler avec un seuil de confiance ??? , un intervalle de confiance pour la moyenne ?? est obtenu à l’aide de l’expression : ???? Dans le cas du test t, la valeur à tester est calculé de la même façon, mais la valeur ?? est lue dans la table de la loi de Stydent à (n-1) degrés de liberté (au- delà de 30 observations, la distribution de t est approximativement normale) Dans le uploads/Management/analyse-de-donnees-cours 1 .pdf

  • 31
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager
  • Détails
  • Publié le Dec 21, 2022
  • Catégorie Management
  • Langue French
  • Taille du fichier 0.0861MB