Lestransformations de données au sein du DWH sont définies par des modèles dedonnées et consistent en des scripts
SQL. Chaque modèle de données génère untableau ou une vue dans le Data Mart.
dbt consiste en la combinaison de
SQL avec
Jinja et offre ainsi plusieurs fonctionnalitésqui facilitent le développement et la maintenance des modèles de données. Avec Data Vault 2.0, la maintenance, l’intégrité des données, les versions et l’historisationpeuvent être assurées malgré la complexité croissante.
Une autrefonction offerte par
dbt est la création automatique de graphiques de linéairesqui permettent de suivre toutes les étapes de transaction précédentes d’untableau de données de manière clairement visualisée.
Avec
Airflow l'ensemble du processus de transformationdes données est orchestré. Les tâches individuelles du pipeline d’ingénieriedes données sont programmées dans des scripts Python et, grâce à
Airflow, ellessont présentées en détail avec l’état, les moments et la durée d’exécution, etplus encore.
Avec
Superset, nous disposons d’un outil puissant pour l’analyse et la visualisation desdonnées. Celui-ci convient aussi bien comme outil BI en libre-service que pourle développement individuel de tableaux de bord. Dans
Superset, les éléments d’unebase de données (dans notre cas, les data marts spécifiques au projet du DWH) peuvent être exposés directement en tant que sets de données ou importésindividuellement à l’aide du SQL Lab intégré par des requêtes SQL sur mesure.Les ensembles de données peuvent être préparés et représentés visuellement dansdes graphiques. Divers types de graphiques sont disponibles, par exemple des barplots, des séries de lignes de temps, des tachymètres, des graphiques de réseau, ou des
visualisationsde cartes (basées sur deck.gl). Les graphiques peuvent être intégrés dans destableaux de bord et y être organisés et présentés de manière visuellementattrayante avec des éléments de style tels que des onglets et des grilles d’organisation. De plus, ils offrent différentes options de filtrage qui permettent auxutilisateurs de consulter les graphiques de manière individuelle et d’explorerles ensembles de données sous-jacents.