Die Datentransformationen innerhalb des DWH werden durch Datenmodelle definiert und bestehen aus SQL-Skripts. Jedes Datenmodell generiert eine Tabelle oder eine View im Data Mart.
dbt besteht aus der Kombination von SQL mit
Jinja und bietet dadurch einige Features, welche die Entwicklung und den Unterhalt von Datenmodellen erleichtern. Mit Data Vault 2.0 können Wartung, Datenintegrität, Versionierungen und Historisierung trotz steigender Komplexität sichergestellt werden.
Ein weiteres Feature, welches
dbt anbietet, sind die automatisch erstellten Lineage Graphs, welche es erlauben, alle vorangegangenen Transaktionsschritte einer Datentabelle übersichtlich visualisiert nachzuverfolgen. So besteht jederzeit Transparenz über die Herkunft und Verbindung der anzuzeigenden Daten.
Mit
Airflow wird der gesamte Datentransformationsprozess orchestriert. Einzelne Tasks der Data Engineering Pipeline werden in Python-Skripts programmiert und dank Airflow detailliert dargestellt mit Ausführungsstatus, Ausführungszeitpunkten, Ausführungsdauer und mehr.