Was bedeutet Extrahieren, Transformieren, Laden?
Extract Transform Load (ETL) ist der Prozess der Extraktion, Transformation und des Ladens während der Nutzung der Datenbank, insbesondere aber während der Nutzung der Datenspeicherung. Er umfasst die folgenden Teilprozesse:
- Abrufen von Daten aus externen Datenspeichern oder Übertragungsquellen
- Umwandlung von Daten in ein verständliches Format, wobei die Daten in der Regel zusammen mit einem Fehlererkennungs- und -korrekturcode gespeichert werden, um den betrieblichen Anforderungen gerecht zu werden
- Übermittlung und Laden von Daten an die Gegenstelle
Techopedia erklärt Extract Transform Load
Die erste Phase eines ETL-Prozesses konzentriert sich auf das Abrufen der Daten aus der Speicherquelle. Die meisten Datenspeicherprojekte integrieren Daten, die aus verschiedenen Quellsystemen stammen. Jedes einzelne System kann eine eigene Datenorganisation oder ein eigenes Datenformat verwenden. Übliche Datenquellenstrukturen sind relationale Datenbanken und reine Datendateien.
Sie können auch nicht-relationale Datenbankmuster wie Informationsmanagementsysteme oder andere Datenstrukturen wie die virtuelle Speicherzugriffsmethode (VSAM) oder die indizierte sequentielle Zugriffsmethode (ISAM) umfassen. Zu den Datenquellen können auch externe Quellen gehören, wie z. B. Daten, die aus dem Internet oder über ein Scanning-System kommen.
Die Transformationsphase verwendet eine Reihe von Regeln oder Operationen, um reine Daten aus der Quelle abzurufen und die Daten in ihrer endgültigen Form für die Bearbeitung auf der Empfängerseite bereitzustellen. Einige Datenquellen benötigen nur sehr wenig oder gar keine Datenverarbeitung. Manchmal sind eine oder mehrere Transformationen erforderlich, um die geschäftlichen und technischen Anforderungen der Zieldatenbank zu erfüllen.
Die Lade- oder Übertragungsphase zielt darauf ab, die Daten an die empfangende Seite zu senden, bei der es sich wahrscheinlich um eine Datenspeicherung handelt. Je nach den Anforderungen der Anwendung kann dieser Prozess sehr einfach oder sehr kompliziert sein. Bei einigen Methoden der Datenspeicherung können alte Daten durch kumulative Daten ersetzt werden. Die Aktualisierung der extrahierten Daten erfolgt normalerweise in regelmäßigen Abständen.