Wat is supervised learning?
Supervised learning is een benadering van machine learning (ML) waarbij gelabelde datasets en correcte uitvoer worden gebruikt om leeralgoritmen te trainen in het classificeren van gegevens of het voorspellen van een uitkomst.
Supervised learning is nuttig voor het groeperen van gegevens in specifieke categorieën (classificatie) en het begrijpen van de relatie tussen variabelen om voorspellingen te doen (regressie).
Het wordt gebruikt om productaanbevelingen te doen, klanten te segmenteren op basis van klantgegevens, ziektes te diagnosticeren op basis van eerdere symptomen en vele andere taken uit te voeren.
Techopedia verklaart supervised learning
Met supervised learning kunnen machines objecten, problemen of situaties classificeren op basis van gerelateerde data die aan de machines worden toegevoerd. De computers worden herhaaldelijk gevoed met gegevens zoals kenmerken, patronen, afmetingen, kleur en hoogte van objecten, mensen of situaties totdat de machines in staat zijn om nauwkeurige classificaties uit te voeren.
Door middel van supervised learning krijgt een machine data, in datamining jargon training data genoemd, op basis waarvan de machine classificaties kan uitvoeren. Als een systeem bijvoorbeeld fruit moet classificeren, krijgt het trainingsgegevens zoals kleur, vorm, afmeting en grootte. Op basis van deze gegevens zou het in staat zijn om fruit te classificeren.
Meestal heeft een systeem meerdere iteraties van een dergelijk proces nodig om nauwkeurig te kunnen classificeren. Aangezien classificaties in het echte leven, zoals het opsporen van creditcardfraude en het classificeren van ziekten, complexe taken zijn, hebben de machines geschikte gegevens en meerdere iteraties van leersessies nodig om redelijke vaardigheden te bereiken.