Maskininlärning (ML)

Vad innebär maskininlärning (ML)?

Maskininlärning (ML) är en underkategori av artificiell intelligens (AI) som bygger algoritmiska modeller för att identifiera mönster och relationer i data. I det här sammanhanget är ordet maskin en synonym för datorprogram och ordet lärande beskriver hur ML-algoritmer blir mer exakta när de tar emot ytterligare data.

Konceptet med maskininlärning är inte nytt, men dess praktiska tillämpning i näringslivet var inte ekonomiskt genomförbar förrän internet och de senaste framstegen inom big data-analys och cloud computing gjorde sitt intåg. Det beror på att det krävs mycket beräkningsresurser och tillgång till stora datamängder för att träna en ML-algoritm att hitta mönster i data.

Termerna artificiell intelligens och maskininlärning används ibland som synonymer eftersom de flesta AI-initiativ fram till nyligen har varit smala och de flesta ML-modeller byggdes för att utföra en enda uppgift, använde övervakad inlärning och krävde stora, märkta datauppsättningar för träning. Idag kan RPA (robotic process automation) användas för att automatisera förbehandlingen av data och göra det mycket snabbare att träna en maskininlärningsalgoritm.

Techopedia förklarar maskininlärning (ML)

Högkvalitativa maskininlärningsmodeller kräver högkvalitativa träningsdata och tillgång till stora datamängder för att kunna extrahera funktioner som är mest relevanta för specifika affärsmål och avslöja meningsfulla samband.

Modeller för maskininlärning

En maskininlärningsmodell är helt enkelt resultatet av en ML-algoritm som har körts på data. Följande steg ingår i uppbyggnaden av en maskininlärningsmodell:

  • Samla in träningsdata.
  • Förbereda data för träning.
  • Bestämma vilken inlärningsalgoritm som ska användas.
  • Träna inlärningsalgoritmen.
  • Utvärdera inlärningsalgoritmens utdata.
  • Vid behov justera de variabler (hyperparametrar) som styr träningsprocessen för att förbättra resultatet.

I en typisk ML-miljö kräver övervakade maskininlärningsalgoritmer en dataset som består av exempel där varje exempel består av en ingång och utgång. I en sådan miljö är ett typiskt mål med att träna en ML-algoritm att uppdatera parametrarna för en prediktiv modell för att säkerställa att modellens beslutsträd konsekvent ger önskade resultat. Det är här entropi kommer in i bilden.

Entropi är en matematisk formel som används för att kvantifiera oordning och slumpmässighet i ett slutet system. I maskininlärningsprojekt är ett viktigt mål att se till att entropin förblir så låg som möjligt eftersom detta mått kommer att avgöra hur modellens beslutsträd väljer att dela upp data.

Utbildning i maskininlärning

Det finns tre huvudtyper av algoritmer som används för att träna maskininlärningsmodeller: övervakad inlärning, oövervakad inlärning och förstärkningsinlärning.

  • Supervised learning – algoritmen får märkta träningsdata (input) och visas det korrekta svaret (output). Denna typ av inlärningsalgoritm använder resultat från historiska datauppsättningar för att förutsäga utgångsvärden för nya, inkommande data.
  • Oövervakad inlärning – algoritmen får träningsdata som inte är märkta. Istället för att uppmanas att förutsäga rätt utdata använder denna typ av inlärningsalgoritm träningsdata för att upptäcka mönster som sedan kan tillämpas på andra grupper av data som uppvisar liknande beteende. I vissa situationer kan det vara nödvändigt att använda en liten mängd märkta data med en större mängd omärkta data under träningen. Denna typ av utbildning kallas ofta semi-supervised machine learning.
  • Förstärkningsinlärning – istället för att få träningsdata får algoritmen en belöningssignal och letar efter mönster i data som ger belöningen. Denna typ av inlärningsalgoritm får ofta sin input från inlärningsalgoritmens interaktion med en fysisk eller digital miljö.

Vad orsakar bias i maskininlärning?

Det finns en växande önskan hos allmänheten att artificiell intelligens – och i synnerhet algoritmer för maskininlärning – ska vara transparenta och förklarbara, men algoritmisk transparens för maskininlärning kan vara mer komplicerad än att bara dela med sig av vilken algoritm som användes för att göra en viss förutsägelse.

Många som är nya inom ML blir förvånade när de upptäcker att det inte är de matematiska algoritmerna som är hemliga; de flesta av de populära ML-algoritmer som används idag är faktiskt fritt tillgängliga. Det är träningsdata som har ett proprietärt värde, inte den algoritm som används.

Eftersom de data som används för att träna en inlärningsalgoritm väljs ut av en människa kan de tyvärr oavsiktligt leda till att den ML-modell som byggs blir partisk. Inlärningsalgoritmernas iterativa natur kan också göra det svårt för ML-ingenjörer att gå tillbaka och spåra logiken bakom en viss förutsägelse.

När det är möjligt för en datavetare eller ML-ingenjör att förklara hur en specifik förutsägelse gjordes, kan en ML-modell kallas förklarbar AI. När det inte är möjligt att avslöja hur en specifik förutsägelse gjordes – antingen för att matematiken blir för komplicerad eller för att träningsdata är skyddade – kan ML-modellen kallas för black box AI.

MLops

Maskininlärningsprojekt övervakas vanligtvis av datavetare och maskininlärningsingenjörer. Datavetarens jobb innebär vanligtvis att skapa en hypotes och skriva kod som förhoppningsvis kommer att bevisa att hypotesen är sann. En ML-ingenjörs jobb fokuserar på maskininlärningsoperationer (MLOps).

Machine learning operations är ett sätt att hantera hela livscykeln för en maskininlärningsmodell – inklusive utbildning, tuning, daglig användning i en produktionsmiljö och eventuell pensionering. Det är därför ML-ingenjörer måste ha en fungerande kunskap om datamodellering, funktionsteknik och programmering – utöver att ha en stark bakgrund inom matematik och statistik.

I idealfallet samarbetar datavetare och ML-ingenjörer i samma organisation när de beslutar vilken typ av inlärningsalgoritm som fungerar bäst för att lösa ett visst affärsproblem, men i vissa branscher är ML-ingenjörens jobb begränsat till att besluta vilka data som ska användas för utbildning och hur maskininlärningsmodellernas resultat ska valideras.

Relaterade termer

Margaret Rouse

Margaret Rouse är en prisbelönt teknisk skribent och lärare som är känd för sin förmåga att förklara komplexa tekniska ämnen för en icke-teknisk affärspublik. Under de senaste tjugo åren har hennes förklaringar publicerats på TechTargets webbplatser och hon har citerats som en auktoritet i artiklar av New York Times, Time Magazine, USA Today, ZDNet, PC Magazine och Discovery Magazine.Margarets idé om en rolig dag är att hjälpa IT- och affärsproffs att lära sig tala varandras högt specialiserade språk. Om du har ett förslag på en ny definition eller hur man kan förbättra en teknisk förklaring, vänligen maila Margaret eller kontakta…