Was ist Data Mining?
Data Mining ist der Prozess der Analyse verborgener Datenmuster nach verschiedenen Gesichtspunkten, um diese Daten in nützliche und oft umsetzbare Informationen zu verwandeln.
Daten werden in gemeinsamen Bereichen wie Data Warehouses gesammelt und zusammengestellt, und Data-Mining-Algorithmen suchen nach Mustern, die Unternehmen nutzen können, um bessere Entscheidungen zu treffen, z. B. Entscheidungen, die zu Kostensenkungen, Umsatzsteigerungen oder einer besseren Betreuung von Kunden oder Klienten beitragen.
Data Mining wird auch als Datenermittlung oder Wissensermittlung bezeichnet. Es ist ein wichtiger Bestandteil der Business Intelligence, um datengestützte Entscheidungen zu treffen.
Techopedia erklärt Data Mining
Die wichtigsten Schritte in einem Data-Mining-Prozess sind:
- Extrahieren, Umwandeln und Laden von Daten in ein Data Warehouse
- Speichern und Verwalten von Daten in einer mehrdimensionalen Datenbank
- Bereitstellung des Datenzugriffs für Unternehmensanalysten mithilfe von Anwendungssoftware
- Analysierte Daten in leicht verständlicher Form, z. B. als Diagramme, darstellen
Der erste Schritt beim Data Mining ist das Sammeln relevanter, geschäftskritischer Daten. Unternehmensdaten sind entweder Transaktionsdaten, nicht-operative Daten oder Metadaten. Transaktionsdaten befassen sich mit alltäglichen Vorgängen wie Verkäufen, Beständen und Kosten.
Bei nicht-operativen Daten handelt es sich in der Regel um Prognosen, während sich Metadaten mit dem logischen Datenbankdesign befassen. Muster und Beziehungen zwischen Datenelementen können oft wichtige Informationen zur Verbesserung von Geschäftsprozessen liefern.
Unternehmen mit starker Kundenorientierung arbeiten mit Data-Mining-Techniken, die ein klares Bild der verkauften Produkte, der Preise, der Konkurrenz und der demografischen Daten der Kunden liefern.
Der Einzelhandelsriese Walmart beispielsweise überträgt alle relevanten Informationen in ein Data Warehouse mit Terabytes an Daten. Diese Daten sind für die Lieferanten leicht zugänglich und ermöglichen es ihnen, das Kaufverhalten der Kunden zu erkennen. Mithilfe von Data-Mining-Techniken können sie Muster zu Einkaufsgewohnheiten, meistgekauften Tagen, meistgefragten Produkten und anderen Erkenntnissen erstellen.
Der zweite Schritt beim Data Mining ist die Auswahl eines geeigneten Algorithmus – eines Mechanismus, der ein Data-Mining-Modell erstellt. Die allgemeine Funktionsweise des Algorithmus besteht darin, Trends in einem Datensatz zu erkennen und die Ergebnisse zur Definition von Parametern zu verwenden.
Die gängigsten Algorithmen für das Data Mining sind Klassifizierungs- und Regressionsalgorithmen, die zur Ermittlung von Beziehungen zwischen Datenelementen verwendet werden. Große Datenbankanbieter wie Oracle und SQL verwenden Data-Mining-Algorithmen wie Clustering und Regressionsbäume, um die Nachfrage nach Data Mining zu befriedigen.