Informatique Décisionnelle Année Universitaire:2020-2021 1 Partie 1: Introducti

Informatique Décisionnelle Année Universitaire:2020-2021 1 Partie 1: Introduction Générale 2 C’est quoi l’informatique décisionnelle? L'informatique décisionnelle est l'ensemble des méthodes, moyens et outils informatiques utilisés pour piloter une entreprise et aider à la prise de décision. L'aide à la prise de décision est la responsabilité de quelques personnes dans l'entreprise appelés décideurs. Les décideurs s'intéressent à l'ensemble de l'activité et souhaitent avoir une vue globale de la société. 3 L’Intérêt de l’informatique décisionnelle? Les décideurs d'une entreprise doivent pouvoir répondre à un certain nombre de question pour diriger leur entreprise : Qui sont mes clients ? Pourquoi sont ils mes clients ? Comment cibler ma clientèle ? Quel est l'évolution de tel produit ? Qui sont mes employés ? ... L'objectif est donc d'apporter aux décideurs d'une entreprise les moyens de répondre à ces questions, de connaître les tendances des clients pour ainsi bien anticiper les réactions de ses derniers et donc de fidéliser les clients. 4 Nouveaux besoins! Pour prendre de « bonnes décisions », on doit pouvoir: Accéder en temps réel aux données de l'entreprise, Traiter ces données, Extraire l'information pertinente de ces données, par exemple pour savoir : 1. Quels sont les résultats des ventes par gamme de produit et par région de l'année dernière ? ! 2. Quelle est l'évolution des chiffres d'affaires par type de magasin et par période ? ! 3. Comment qualifier les acheteurs de mon produit X ? 5  La prise de décisions stratégiques dans une organisation nécessite le recours et le croisement de multiples informations qui concernent tous les départements : production, RH, achats, ventes, marketing, service après-vente, maintenance, R&D...  Or ces données sont généralement :  éparpillées au sein des départements et non connectées entre elles  hétérogènes dans leurs formats techniques et leurs organisations structurelles, voire leurs sémantiques  implémentées pour l'action et non pour l'analyse  volatiles, au sens où leur mise à jour peut conduire à oublier des informations obsolètes 6 Problématique!!! Objectifs d’un système décisionnel  Transformer un système d’information qui avait une vocation de production en un système d’information décisionnel. Transformation des données de production en informations stratégiques  Les données doivent être :  Extraites  Groupées et organisées  Corrélées  Transformées (résumé, agrégation) 7 OLTP et OLAP (1/2) Les systèmes informatiques peuvent se subdiviser en deux. Le système transactionnel OLTP (On-Line Transaction Processing) Le système analytique OLAP. (On-Line Analytical Processing) Les systèmes OLTP servent, en général, de source de données pour les systèmes OLAP qui sont quant à eux, source d’analyse des données qui vont permettre d’aboutir à la décision. Vous comprendrez alors qu’OLTP et OLAP ont des objectifs opposés et ont un stockage de données différent faisant l’objet de requêtes différentes. 8 9 OLTP vs OLAP (2/2) Caractéristiques OLTP OLAP Applications production aide à la décision Utilisateurs un département professionnel IT transversal (entreprise) décideur non IT Données normalisées, non agrégées dénormalisées, agrégées Requêtes simples, nombreuses, régulières, prévisibles, répétitives complexes, peu nombreuses, irrégulières, non prévisibles Nb tuples invoqués par requête (moyenne) dizaines millions Taille données 100 MB à 1 GB 1 GB à 1 TB Ancienneté des données récente, mises à jour historique Partie 2: Entrepôt de données (Datawarehouse) 10 Data Warehouse ou entrepôt de données Définition et objectifs (1/4)  Les datawarehouse sont des systèmes conçus pour l’aide à la prise de décision. (Mode de travail: OLAP On-Line Analytical Processing)  D’après BILL Inmon (1996) : « Un DW est une collection de données orientées sujet, intégrées, non volatiles, historisées, organisées pour la prise de décision. »  Les objectifs principaux sont regrouper, organiser des informations provenant de sources diverses, les intégrer et les stocker pour donner à l’utilisateur une vue orientée métier (sujet), retrouver et analyser l’information facilement et rapidement. 11 Data Warehouse ou entrepôt de données Définition et objectifs (2/4) 12 Dans un entrepôt de données les données sont: 1. Orientées sujet: thèmes par activités majeures ; Le datawarehouse est lui organisé autour des sujets majeurs de l'entreprise. 2. Intégrées: Les données proviennent de plusieurs sources différentes. Avant d'être intégrées au sein du datawarehouse elles doivent être mise en forme et unifiées afin d'en assurer la cohérence. Cela nécessite une forte normalisation. 13 Data Warehouse ou entrepôt de données Définition et objectifs (3/4) 3. Non volatiles: Un datawarehouse veut conserver la traçabilité des informations et des décisions prises. Les données ne sont ni modifiées ni supprimées. Une requête émise sur les mêmes données à plusieurs mois d'intervalles doit donner le même résultat. 4. Historisées: Contrairement au système de production les données ne sont jamais mises à jour. Chaque nouvelle données est insérées. Un référentiel de temps doit être mis en place afin de pouvoir identifier chaque donnée dans le temps. 14 Datawarehouse ou entrepôt de données Définition et objectifs (4/4) Pourquoi ne pas réutiliser les SGBD?  Les SGBD sont des systèmes dont le mode de travail est transactionnel (OLTP On-Line Transaction Processing).  Permet d'insérer, modifier, interroger des informations rapidement, efficacement, en sécurité.  Deux objectifs principaux :  Sélectionner, ajouter, mettre à jour et supprimer des tuples  Ces opérations doivent pouvoir être effectuées très rapidement, et par de nombreux utilisateurs simultanément.  En conclusion, Les systèmes OLTP sont mal adaptés à l'analyse de données. 15 Architecture Globale d’un système décisionnel 16 Data Warehouse et Datamart  Un Data Warehouse et un Data Mart se distinguent par le spectre qu'il recouvre :  Le Data Warehouse recouvre l'ensemble des données et problématiques d'analyse visées par l'entreprise.  Le Datamart recouvre une partie des données et problématiques liées à un métier ou un sujet d'analyse en particulier.  Un Datamart est un sous- ensemble du Data Warehouse de l'entreprise, obtenu par extraction et agrégation des données de celui-ci. 17 Il existe deux schémas possibles pour la modélisation de l’entrepôt : le schéma en étoile le schéma en flocon. Quel que soit le modèle considéré, on distinguera : la table des faits qui contient l’information à analyser (par exemple les ventes) des tables de dimensions qui contiennent les informations sur les dimensions d’analyse (par exemple le lieu, le temps, la description du produit). 18 Datawarehouse ou entrepôt de données Modélisation (1/2)  Pour la Modélisation conceptuelle BD : entité et relation  Pour la Modélisation de DW : dimension et mesure  Les mesures sont les valeurs numériques que l’on compare (ex : montant_ventes, qte_vendue) Ces valeurs sont le résultat d’une opération d’agrégation des données  Les dimensions sont les points de vues depuis lesquels les mesures peuvent être observées : Ex : date, localisation, produit, etc. Elles sont stockées dans les tables de dimensions 19 Datawarehouse ou entrepôt de données Modélisation (2/2) Modélisation du DW Dimension  Une dimension peut être définie comme : un thème, ou un axe (attributs), selon lequel les données seront analysées Ex : Temps, Région, Produits...  Une dimension contient des membres organisés en hiérarchie: Chacun des membres appartient à un niveau hiérarchique (ou niveau de granularité) particulier Ex : pour la dimension Temps: année – semestre – mois – jour 20 Modélisation du DW Mesure – fait – table de faits  Une mesure est un élément de donnée sur lequel portent les analyses, en fonction des différentes dimensions  Exemple : coût des travaux, nombre d’accidents, ventes  Un fait représente la valeur d’une mesure, mesurée ou calculée, selon un membre de chacune des dimensions  Exemple : «250 000 euros » est un fait qui exprime la valeur de la mesure « coût des travaux » pour le membre « 2002 » du niveau année de la dimension « temps » et le membre « Versailles » du niveau « ville » de la dimension « découpage administratif »  Les mesures sont stockées dans les tables de faits Table de fait contient les valeurs des mesures et les clés vers les tables de dimensions 21 Le Modèle en étoile Avantages et inconvénients  Une (ou plusieurs) table(s) de faits comprenant une (ou plusieurs) mesures.  Plusieurs tables de dimension dénormalisées  Les tables de dimension n'ont pas de lien entre elles Avantages :  Facilité de navigation  Alimentation facile.  Performances : nombre de jointures limité ; gestion des données creuses.  Gestion des agrégats Inconvénients :  Toutes les dimensions ne concernent pas les mesures  Redondances dans les dimensions 22 Le Modèle en étoile Exemple1 23 24 Le Modèle en étoile Exemple2 Le Modèle en flocons Avantages et inconvénients  Le schéma en flocon est dérivé du schéma en étoile où les tables de dimensions sont normalisées (la table des faits reste inchangée).  Avec ce schéma, chacune des dimensions est décomposée selon sa (ou ses) hiérarchie(s).  Exemple : Commune, Département, Région, Pays, Continent  Utilisé lorsque les tables sont trop volumineuses Avantages : réduction du volume, Inconvénients : navigation difficile, nombreuses jointures. Alimentation complexe. 25 Le Modèle en flocons Exemple 26  La modélisation en constellation consiste à fusionner plusieurs modèles en étoile qui utilisent des dimensions communes.  Un modèle en uploads/Management/cours-bi.pdf

  • 33
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager
  • Détails
  • Publié le Mar 05, 2021
  • Catégorie Management
  • Langue French
  • Taille du fichier 1.3169MB