FICHE Nº2 : RECODER DES DONNEES, CALCULER DES VARIABLES & SELECTIONNER DES OBSE

FICHE Nº2 : RECODER DES DONNEES, CALCULER DES VARIABLES & SELECTIONNER DES OBSERVATIONS Recoder des données… Il est parfois nécessaire de recoder des variables, { soit parce que le codage initial n'est pas satisfaisant, | soit parce qu'il ne facilite pas l'interprétation des résultats. { Quand le codage initial n'est pas satisfaisant… Par exemple, dans le fichier "Voitures1", il existe une variable qui indique le nombre de cylindres des véhicules. Le codage du nombre de cylindres est ici assez surprenant : la valeur accordée à 4 cylindres est inférieure à celle accordée à 3 cylindres, etc. Nous allons donc recoder cette variable. Deux possibilités s'offrent à nous. Soit on remplace les valeurs erronées au sein de la même variable, soit on crée une nouvelle variable. Cette dernière solution est plus prudente. En effet, si en remplaçant les valeurs erronées une erreur est commise (et qu'il n'existe pas de copie de sauvegarde du fichier des données2), il est impossible de revenir en arrière. Ouvrir le fichier des données (l'opération est impossible lorsque l'on se trouve sur un fichier de résultats). 1 Le fichier "Voitures" est fourni avec le logiciel SPSS 10.0. 2 D'où l'intérêt de toujours avoir une copie de sauvegarde des données sur laquelle on ne travaille pas. © 2001, I. Prim et D. Darpy 1 Fiche nº2 Sélectionner Transformer Æ Recoder Æ Création de variables Sélectionner la variable à recoder † Donner un nom et une étiquette à la variable de destination, puis cliquer sur Remplacer ‡ Cliquer sur Anciennes et nouvelles valeurs pour opérer le recodage Indiquer l’ancienne valeur † Indiquer la nouvelle valeur ‡ Cliquer sur Ajouter et recommencer tant qu’il reste des valeurs à recoder. Pour terminer, cliquer sur Poursuivre Aller ensuite dans l'onglet Affichage des variables de façon à taper les étiquettes de valeur et à vérifier les caractéristiques de la variable ainsi créée. © 2001, I. Prim et D. Darpy 2 Fiche nº2 On obtient ainsi une nouvelle variable convenablement codée. | Quand le codage initial ne facilite pas l'interprétation des résultats… Le codage retenu, ci-dessous, est contre-intuitif si l'on cherche à mesurer le caractère cinéphile de la personne interrogée. En effet, "7" indique que la personne ne se considère pas cinéphile et "1" qu'elle se considère particulièrement cinéphile. Pas du tout d'accord Å Æ Tout à fait d'accord Je me considère comme un vrai cinéphile 7 6 5 4 3 2 1 Dans ce cas, il est préférable de recoder la variable selon la procédure indiquée en {, de la façon suivante : Ancienne valeur Nouvelle valeur 7 Æ 1 6 Æ 2 5 Æ 3 4 Æ 4 3 Æ 5 2 Æ 6 1 Æ 7 Calculer des variables… Il est parfois nécessaire de faire des calculs sur des variables, { soit pour le recodage d'une variable, | soit pour le calcul d'une nouvelle variable à partir d'une combinaison de variables. { Quand le recodage consiste en un calcul d'une nouvelle variable à partir d'une variable existante… Par exemple, lorsque l'on a une note de 1 à 5, on peut souhaiter la ramener sur 20 de façon à faire référence à un système de notation auquel les français sont bien habitués. Dans ce cas, il faut multiplier les valeurs initiales par 4. © 2001, I. Prim et D. Darpy 3 Fiche nº2 Sélectionner Transformer Æ Calculer Sélectionner la variable à trasformer ˆ Cliquer sur Poursuivre puis OK † Définir l’opération mathématique, soit en utilisant le clavier de l’ordinateur, soit en utilisant celui de la boîte de dialogue ‡ Donner un nom et une étiquette à la variable de destination | Quand le recodage consiste à la création d'une variable à partir d'une combinaison de variables… Il est parfois intéressant d'additionner deux variables, par exemple lorsque l'on a plusieurs variables binaires que l'on souhaite transformer en une seule variable nominale3. Dans ce cas, chacune des variables était codée 0/1. On laisse la première ainsi. Il faut ensuite transformer la deuxième variable en 0/2, puis la troisième en 0/3, etc. Exemple avec la question "parmi la liste des émissions TV, ci-dessous, quelle est votre émission préférée?". (NB : Ce recodage n’est pas utilisable en cas de réponses multiples, comme par exemple dans le cas de la question "parmi la liste des émissions TV, ci-dessous, quelles est vos trois émissions préférées?") Emission Codage initial (il existe autant de variables que de modalités de réponses) Nouveau codage (variable nominale) ƒ La marche su siècle, F3 0/1 1 ƒ Thalassa, F3 0/1 2 ƒ Capital, M6 0/1 3 ƒ Nulle part ailleurs, Canal+ 0/1 4 3 Pour des informations sur des fréquences, on peut se contenter des "fréquences sur tableau multiple" (cf. Fiche nº1). © 2001, I. Prim et D. Darpy 4 Fiche nº2 Il faut, dans un premier temps, opérer une transformation sur les variables (Transformer Æ Recoder Æ Création de variables, cf. pages 1 et 2 du présent document) avant de les additionner comme indiqué dans le {. Cette opération est à faire pour chacune des variables binaires que l’on souhaite intégrer dans la nouvelle variable binaire Capital est transformé en “3”; Nulle part ailleurs est transformé en “4” Attention : íl n’est pas possible de travailler sur plusieurs variables à la fois. Il faut donc pour chaque variable suivre: Transformer Æ Recoder Æ Création de variable... N.B. : Pour connaître la signification d’une touche, il suffit de positionner le curseur sur la touche et de cliquer sur le bouton droit de la souris © 2001, I. Prim et D. Darpy 5 Fiche nº2 Sélectionner des observations… On peut souhaiter ne travailler que sur une partie du fichier (de l'échantillon). Par exemple, on peut vouloir dissocier les analyses du sous-échantillon des hommes par rapport à celui des femmes. Dans ce cas, on va utiliser une condition logique, du type "ne retenir que les observations pour lesquelles la valeur de la variable sexe est égale à 1". Sélectionner Données Æ Sélectionner des observations Æ Selon une condition logique Æ Si Æ Sélectionner la variable filtre Æ Indiquer la valeur que l'on souhaite retenir Æ Poursuivre Æ OK. ™ œ › š Attention : Lorsque vous souhaitez de nouveau travailler sur l'ensemble du fichier il faut de nouveau sélectionner Données Æ Sélectionner des observations et cocher Toutes les observations. Les individus ainsi momentanément éliminés apparaissent rayés sur le fichier des données La condition logique peut être plus complexe. Par exemple, dans le cas Orlyval, il est possible de vouloir isoler les hommes de 15 à 34 ans. Or la variable sexe est codée 1 (homme), 2 (femme) et la variable âge est codée 2 (15-24 ans) et 3 (25-34 ans). © 2001, I. Prim et D. Darpy 6 Fiche nº2 Transcription de la condition logique Individus sélectionnés Cette méthode est applicable aux questions filtres en permettant de ne retenir, par exemple, que les individus ayant répondu par l'affirmative à une question donnée. POUR ALLER PLUS LOIN… La création d'un filtre correspond à la création d'une variable supplémentaire, comme si on avait calculé une nouvelle variable (cf. supra). Pour conserver les attributs d'un filtre et les utiliser ultérieurement dans l'analyse des données (par exemple, pour confronter les résultats obtenus avec le filtre par rapport à tous les autres résultats), on peut renommer le filtre. Pour cela, aller dans tableau des variables, rechercher filter$ et donner le nom souhaité. © 2001, I. Prim et D. Darpy 7 Fiche nº2 uploads/s3/ fiche2-recoder-les-variables.pdf

  • 37
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager