Dwfacile les composantes Les composantes Voici une explication des pièces maitraisses d'un système ETL Les systèmes opérationnels En général les entrepôts de données sont alimentés à partir des systèmes opérationnels dans le but de transformer les données
Les composantes Voici une explication des pièces maitraisses d'un système ETL Les systèmes opérationnels En général les entrepôts de données sont alimentés à partir des systèmes opérationnels dans le but de transformer les données transactionnelles Ou opérationnelles d'un processus d'a ?aire en information qui sera utile à la prise de décision Cependant il faut bien noter que les entrepôts de données peuvent aussi puiser leurs données dans d'autres entrepôts de données dans un ODS ERP ou CRM Prenons un exemple pour mieux comprendre le besoin d'extraire les données d'un système CRM dans chaque entrepôt de données il est fort probable qu'une table des clients existe Dans un but d'intégration il n'est pas question de disposer de cette table autant de fois qu'il y'a d'applications dans l'entreprise Normalement une seule application CRM permet de gérer cette table et de fournir au autres applications une vue de cette table Évidement on peut imaginer toute sorte de mécanisme Réplication Snapshot pour que ces applications disposent de cette table à jour Dans le même sens il est donc conseillé dans la cas de l'entrepôt de données d'extraire cette table du système CRM au lieu de l'extraire du système opérationnel du processus que l'on veux analyser ou étudier Il existe plusieurs structures de données dans ces systèmes opérationnels les données que l'on désire extraire peuvent donc résider dans une base de données dans des ?chiers plats ou encore dans des systèmes patrimoniaux Legacy systems On peut aussi extraire les données à partir des ?chiers log du Web dans le cas des entrepôts de données d'analyse des clicksstream L'extraction de données L'extraction des données est la première étape dans les systèmes ETL Elle permet de lire les données à partir des systèmes sources Selon la nature de ces systèmes sources critique l'extraction peut s'avérer critique et très exigeante dans le sens ou il faut la réaliser le plus rapidement souvent et ce en exploitant au minimum les ressources du système source En général les extractions sont lancées la nuit durant ce l'on appelle un Extract Window sur lequel on s'est mis d'accord La complexité de l'extraction n'est pas dans le processus de lecture mais surtout dans le respect de l'extract window C'est pour cette raison que l'on e ?ectue rarement des transformations lors de l'extraction d'une part D'autre part on essaye au Cmaximum d'extraire seulement les données utiles Mise à jour ou ajoutée après la dernière extraction et pour ce faire on pourrait s'entendre avec le responsable du système source pour ajouter soit un ag ou encore des dates dans chacune des tables extraites au moins deux dates Date de création de l'enregistrement dans la table et la date de mise à jour En général la plupart des systèmes sources disposent de ces deux dates Par ailleurs pour ne pas perdre des données suites à des problèmes d'extraction il est important de s'assurer que le système source ne purge pas les données avant que l'entrepôt ne les ait extraits La transformation de données La transformation est
Documents similaires










-
44
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Aucune attribution requise- Détails
- Publié le Jan 27, 2022
- Catégorie Management
- Langue French
- Taille du fichier 28.9kB