Data Mining

Transparenz

Was ist Data Mining?

Data Mining ist der Prozess der Analyse verborgener Datenmuster nach verschiedenen Gesichtspunkten, um diese Daten in nützliche und oft umsetzbare Informationen zu verwandeln.

Daten werden in gemeinsamen Bereichen wie Data Warehouses gesammelt und zusammengestellt, und Data-Mining-Algorithmen suchen nach Mustern, die Unternehmen nutzen können, um bessere Entscheidungen zu treffen, z. B. Entscheidungen, die zu Kostensenkungen, Umsatzsteigerungen oder einer besseren Betreuung von Kunden oder Klienten beitragen.

Data Mining wird auch als Datenermittlung oder Wissensermittlung bezeichnet. Es ist ein wichtiger Bestandteil der Business Intelligence, um datengestützte Entscheidungen zu treffen.

Techopedia erklärt Data Mining

Die wichtigsten Schritte in einem Data-Mining-Prozess sind:

  • Extrahieren, Umwandeln und Laden von Daten in ein Data Warehouse
  • Speichern und Verwalten von Daten in einer mehrdimensionalen Datenbank
  • Bereitstellung des Datenzugriffs für Unternehmensanalysten mithilfe von Anwendungssoftware
  • Analysierte Daten in leicht verständlicher Form, z. B. als Diagramme, darstellen

Der erste Schritt beim Data Mining ist das Sammeln relevanter, geschäftskritischer Daten. Unternehmensdaten sind entweder Transaktionsdaten, nicht-operative Daten oder Metadaten. Transaktionsdaten befassen sich mit alltäglichen Vorgängen wie Verkäufen, Beständen und Kosten.

Bei nicht-operativen Daten handelt es sich in der Regel um Prognosen, während sich Metadaten mit dem logischen Datenbankdesign befassen. Muster und Beziehungen zwischen Datenelementen können oft wichtige Informationen zur Verbesserung von Geschäftsprozessen liefern.

Unternehmen mit starker Kundenorientierung arbeiten mit Data-Mining-Techniken, die ein klares Bild der verkauften Produkte, der Preise, der Konkurrenz und der demografischen Daten der Kunden liefern.

Der Einzelhandelsriese Walmart beispielsweise überträgt alle relevanten Informationen in ein Data Warehouse mit Terabytes an Daten. Diese Daten sind für die Lieferanten leicht zugänglich und ermöglichen es ihnen, das Kaufverhalten der Kunden zu erkennen. Mithilfe von Data-Mining-Techniken können sie Muster zu Einkaufsgewohnheiten, meistgekauften Tagen, meistgefragten Produkten und anderen Erkenntnissen erstellen.

Der zweite Schritt beim Data Mining ist die Auswahl eines geeigneten Algorithmus – eines Mechanismus, der ein Data-Mining-Modell erstellt. Die allgemeine Funktionsweise des Algorithmus besteht darin, Trends in einem Datensatz zu erkennen und die Ergebnisse zur Definition von Parametern zu verwenden.

Die gängigsten Algorithmen für das Data Mining sind Klassifizierungs- und Regressionsalgorithmen, die zur Ermittlung von Beziehungen zwischen Datenelementen verwendet werden. Große Datenbankanbieter wie Oracle und SQL verwenden Data-Mining-Algorithmen wie Clustering und Regressionsbäume, um die Nachfrage nach Data Mining zu befriedigen.

Verwandte Begriffe

Margaret Rouse
Redaktion
Margaret Rouse
Redaktion

Margaret Rouse ist eine preisgekrönte technische Autorin und Dozentin. Sie ist für ihre Fähigkeit bekannt, komplexe technische Themen simpel und nachvollziehbar zu erklären. In den letzten zwanzig Jahren sind ihre Erklärungen auf TechTarget-Websites erschienen und sie wurde in Artikeln der New York Times, des Time Magazine, USA Today, ZDNet, PC Magazine und Discovery Magazine als Quelle und Expertin zitiert. Wenn Sie einen Vorschlag für eine neue Definition haben oder eine technische Erklärung verbessern möchten, schicken Sie einfach Margaret eine E-Mail oder kontaktieren Sie sie auf LinkedIn oder Twitter.