Was sind gelabelte Daten?
Gelabelte Daten (engl. Labeled Data) sind mit einem oder mehreren Labels versehene Daten, die bestimmte Eigenschaften oder Merkmale bzw. Klassifizierungen oder enthaltene Objekte kennzeichnen.
Dank der Labels werden diese Daten besonders nützlich für bestimmte Arten des maschinellen Lernens, die als überwachte maschinelle Lernprozesse bekannt sind.
Gelabelte Daten einfach erklärt
Beim überwachten maschinellen Lernen dienen gelabelte Daten als Orientierung für das Training und das Testen von Daten.
Das überwachte maschinelle Lernprogramm kann mit einem Satz vollständig gelabelter Daten beginnen, oder es kann anfänglich gelabelte Daten zur Verarbeitung zusätzlicher nicht gelabelter Daten verwenden.
Überwachtes maschinelles Lernen funktioniert folgendermaßen: Das Programm sieht die gelabelten Daten und führt entsprechende Vergleiche und Analysen durch.
Indem es beispielsweise verschiedene gelabelte Kategorien in ein Streudiagramm einträgt, kann das maschinelle Lernprogramm feststellen, ob aufeinanderfolgende Elemente in die eine oder andere Kategorie fallen.
Die Algorithmen setzen die gelabelten Daten als Grundlage für Entscheidungsparadigmen ein.
Dies steht im Gegensatz zu einer anderen Art des maschinellen Lernens, dem unüberwachten maschinellen Lernen, bei dem nicht gelabelte Daten herangezogen werden.
Beim unüberwachten maschinellen Lernen muss das maschinelle Lernprogramm die Daten ohne Labels nach ihren natürlichen Eigenschaften und Merkmalen bewerten.