Extrahieren Transformieren Laden

Transparenz

Was bedeutet Extrahieren, Transformieren, Laden?

Extract Transform Load (ETL) ist der Prozess der Extraktion, Transformation und des Ladens während der Nutzung der Datenbank, insbesondere aber während der Nutzung der Datenspeicherung. Er umfasst die folgenden Teilprozesse:

  • Abrufen von Daten aus externen Datenspeichern oder Übertragungsquellen
  • Umwandlung von Daten in ein verständliches Format, wobei die Daten in der Regel zusammen mit einem Fehlererkennungs- und -korrekturcode gespeichert werden, um den betrieblichen Anforderungen gerecht zu werden
  • Übermittlung und Laden von Daten an die Gegenstelle

Techopedia erklärt Extract Transform Load

Die erste Phase eines ETL-Prozesses konzentriert sich auf das Abrufen der Daten aus der Speicherquelle. Die meisten Datenspeicherprojekte integrieren Daten, die aus verschiedenen Quellsystemen stammen. Jedes einzelne System kann eine eigene Datenorganisation oder ein eigenes Datenformat verwenden. Übliche Datenquellenstrukturen sind relationale Datenbanken und reine Datendateien.

Sie können auch nicht-relationale Datenbankmuster wie Informationsmanagementsysteme oder andere Datenstrukturen wie die virtuelle Speicherzugriffsmethode (VSAM) oder die indizierte sequentielle Zugriffsmethode (ISAM) umfassen. Zu den Datenquellen können auch externe Quellen gehören, wie z. B. Daten, die aus dem Internet oder über ein Scanning-System kommen.

Die Transformationsphase verwendet eine Reihe von Regeln oder Operationen, um reine Daten aus der Quelle abzurufen und die Daten in ihrer endgültigen Form für die Bearbeitung auf der Empfängerseite bereitzustellen. Einige Datenquellen benötigen nur sehr wenig oder gar keine Datenverarbeitung. Manchmal sind eine oder mehrere Transformationen erforderlich, um die geschäftlichen und technischen Anforderungen der Zieldatenbank zu erfüllen.

Die Lade- oder Übertragungsphase zielt darauf ab, die Daten an die empfangende Seite zu senden, bei der es sich wahrscheinlich um eine Datenspeicherung handelt. Je nach den Anforderungen der Anwendung kann dieser Prozess sehr einfach oder sehr kompliziert sein. Bei einigen Methoden der Datenspeicherung können alte Daten durch kumulative Daten ersetzt werden. Die Aktualisierung der extrahierten Daten erfolgt normalerweise in regelmäßigen Abständen.

Verwandte Begriffe

Margaret Rouse
Redaktion
Margaret Rouse
Redaktion

Margaret Rouse ist eine preisgekrönte technische Autorin und Dozentin. Sie ist für ihre Fähigkeit bekannt, komplexe technische Themen simpel und nachvollziehbar zu erklären. In den letzten zwanzig Jahren sind ihre Erklärungen auf TechTarget-Websites erschienen und sie wurde in Artikeln der New York Times, des Time Magazine, USA Today, ZDNet, PC Magazine und Discovery Magazine als Quelle und Expertin zitiert. Wenn Sie einen Vorschlag für eine neue Definition haben oder eine technische Erklärung verbessern möchten, schicken Sie einfach Margaret eine E-Mail oder kontaktieren Sie sie auf LinkedIn oder Twitter.