AI Modelgoedheid Metriek

Betrouwbaarheid

Wat zijn AI modelgoedheid  metrieken?

AI modelgoedheid, of model goodness, metrieken zijn een set regels die ontwikkelaars helpen om te beoordelen hoe goed een AI-model zijn taken uitvoert. Is het nauwkeurig, precies en betrouwbaar in zijn beslissingen?

Deze meetgegevens werpen licht op het vermogen van het programma om de juiste beslissingen te nemen, terwijl het de toegewezen taken uitvoert.

Techopedia legt uit

De term ‘AI’, kort voor kunstmatige intelligentie, is een technologisch concept dat mensachtige intelligentie in computerprogramma’s vastlegt.

AI is de volgende golf van technologische innovatie die verschillende mensachtige taken automatiseert. In essentie stelt AI individuen en bedrijven in staat om efficiënter te werken met minimale investeringen in tijd en middelen. Om dit te bereiken zijn AI-modellen nodig.

AI-modellen zijn software en algoritmes die ontworpen zijn om datasets te analyseren, patronen te identificeren en voorspellingen te doen. Ze worden getraind met gegevens om deze patronen te herkennen en de besluitvorming te ondersteunen. Hoe meer datapunten een AI-model te verwerken krijgt, hoe nauwkeuriger de resultaten.

Deze modellen vormen de kernintelligentie achter computerprogramma’s, begrijpen de afgeleide datasets om datagestuurde beslissingen te nemen. Ze maken gebruik van computervisie, natuurlijke taalverwerking en machine learning om patronen te detecteren.

AI-modellen vinden diverse toepassingen in de echte wereld, van zelfrijdende auto’s tot virtuele assistenten en aanbevelingssystemen.

Om de nauwkeurigheid van deze modellen te garanderen bij het uitvoeren van hun beoogde taken, werden meetmethoden voor AI-modelgoedheid opgesteld. Deze maatstaven richten zich voornamelijk op het evalueren van de juistheid van de beslissingen die AI-modellen nemen.

Een AI-model in de gezondheidszorg heeft bijvoorbeeld de taak om snel ziektes bij patiënten te identificeren wanneer het over de relevante gegevens beschikt.

De goedheid van dit model wordt bepaald door hoe effectief en consistent het dit doel kan bereiken met minimale fouten.

In essentie dient de meting van de goedheid van AI-modellen als een mechanisme om de kwaliteit van AI-programma’s te garanderen, zodat elk AI-model nauwkeurige en betrouwbare voorspellingen doet.

AI Metriek voor het meten van modelgoedheid: Algemene concepten

Verschillende soorten meetmethoden voor AI-modellen worden gebruikt om de prestaties van een programma te beoordelen, waarbij een aanzienlijk deel valt onder het voorspellingstype.

Een daarvan is regressie, die numerieke en continue uitvoer voorspelt. Een ander voorspellend type is de classificatie metriek, die de categorie bepaalt waartoe de uitvoer behoort.

Vier van deze metrieken zijn echter van het grootste belang:

  • Nauwkeurigheid
  • Precisie
  • Recall
  • F1 score

Nauwkeurigheidsmetriek

De nauwkeurigheidsmetriek kan worden vergeleken met een rapport, waarbij wordt gemeten hoe goed een AI-model dingen goed doet. Het is de metriek die wordt gebruikt om de algemene prestaties van het AI-model over alle gerelateerde klassen te beoordelen. Deze metriek is vooral nuttig als alle klassen even belangrijk zijn.

Bijvoorbeeld, een AI-robot krijgt de opdracht om rode van blauwe kleuren te kiezen in een rij van 10. Als de robot erin slaagt om rood te kiezen, worden 7 van de 10 kleuren rood. Als hij 7 van de 10 keer met succes rood kiest, is de nauwkeurigheid 70%, wat boven het gemiddelde is. De nauwkeurigheidsmeter wordt berekend als de verhouding tussen correcte voorspellingen en het totale aantal voorspellingen.

Precisiemetriek

De precisie geeft de mate van voorzichtigheid weer die een AI-model aan de dag legt bij het classificeren van items zonder buitensporige fouten te maken. Deze wordt meestal berekend als de verhouding tussen het aantal echt positieve monsters (die correct als positief zijn gelabeld) en het totale aantal monsters dat als positief is geclassificeerd (correct of onjuist).

In essentie beoordeelt precisie de nauwkeurigheid van een AI-model bij het correct identificeren van een monster als positief. Een goed voorbeeld is wanneer een AI-gestuurde sorteermachine snel appels uit een stapel fruit sorteert. Als de machine 80% van alle appels uit de stapel nauwkeurig sorteert, wordt de nauwkeurigheid weergegeven door dit percentage. Dit geeft aan dat het AI-model waarschijnlijk fouten minimaliseert in zijn taken.

Recall-metriek

De recall-metriek focust op het garanderen dat een AI-model geen kritieke of belangrijke informatie over het hoofd ziet. Het primaire doel is ervoor te zorgen dat het AI-model zijn missie uitvoert.

In essentie meet het de efficiëntie van een AI-model om te bepalen of er genoeg positieve steekproeven zijn die het gebruik ervan op de lange termijn ondersteunen. Het is gefixeerd op hoe de positieve monsters worden geclassificeerd.

De recall-metriek is de verhouding tussen het aantal positieve monsters binnen een pool dat nauwkeurig als positief is geclassificeerd en het totale aantal positieve monsters. Hoe hoger de recall, hoe meer positieve monsters er worden geïdentificeerd.

F1 score metriek

Deze AI-model goedheid meetmethode is een samenvoeging van de precisie en recall metrische scores in een holistische eenheid. Er wordt een balans gevonden tussen het minimaliseren van fouten en het niet over het hoofd zien van cruciale details in de uitvoer van het AI-model.

Om dit te bereiken combineert de F1 score de recall en precision metric met behulp van hun harmonisch gemiddelde. Het genereren van een basis F1 score betekent dus impliciet het maximaliseren van zowel de recall als de precision metriek.

Deze meetgegevens helpen gebruikers te bepalen hoe goed een AI-model presteert, zowel in silo’s (testomgevingen) als in de echte wereld. Ze leggen de kwaliteit van de output van een AI-model vast om te garanderen dat het de gegeven doelen kan bereiken.

Geschiedenis van kunstmatige intelligentie (AI)

De eerste ideeën over intelligentie op machineniveau werden bedacht door Alan Turing. In 1935 beschreef Turing een abstracte computer die bestond uit een onbeperkt geheugen en een scanner die symbool voor symbool heen en weer reisde door het geheugen.Deze abstracte computer leest vervolgens wat het vindt en stelt zelfstandig zijn eigen set symbolen samen.

In de loop der jaren is AI getest, aangepast en uitgevoerd in verschillende vormen.

Hieronder staan de meest prominente gebeurtenissen:

Jaar Evenement(s)
1951 Christopher Strachey schreef het eerste programma voor kunstmatige intelligentie. Later maakte hij op basis hiervan een dam programma. Het dam programma draaide op de Ferranti Mark 1 computer van de Universiteit van Manchester, Engeland.
1952 Strachey’s programma was in staat om zonder hulp een compleet spel te spelen met een redelijke snelheid.
1952 Arthur Samuel introduceerde het dam programma in de Verenigde Staten. Zijn werk droeg bij aan de lancering van de IBM 701 computer.
1955 Samuel wijzigt het oorspronkelijke dam programma en voegt de mogelijkheid toe om te leren van ervaringen via rote learning en generalisaties. Dit diende als basis voor de ontwikkeling van AI jaren later.

Conclusie

Tientallen jaren later heeft de AI-revolutie een onuitwisbare stempel gedrukt op verschillende sectoren, waaronder de gezondheidszorg, de financiële sector, het transport en de logistiek. Deze geavanceerde computerprogramma’s worden nu op grote schaal gebruikt in verschillende sectoren.

Het vermogen van AI om zo naadloos te functioneren is te danken aan de AI-modelleringsactiviteiten die achter de schermen plaatsvinden. Nog belangrijker zijn de meetmethoden voor AI-modelgoedheid, die ervoor zorgen dat deze modellen werken zoals verwacht.

AI-modelgoedheids metrieken zijn dan ook de checks and balances bij het uitvoeren van deze geavanceerde computerprogramma’s.

Gerelateerde begrippen

Margaret Rouse
Redacteur
Margaret Rouse
Redacteur

Margaret Rouse is een bekroond technisch schrijver en docent die bekend staat om haar vermogen om complexe technische onderwerpen uit te leggen aan een niet-technisch, zakelijk publiek. In de afgelopen twintig jaar is haar uitleg verschenen op vele websites en is ze als autoriteit aangehaald in artikelen van de New York Times, Time Magazine, USA Today, ZDNet, PC Magazine en Discovery Magazine. Margaret geniet ervan om IT- en business professionals te helpen om elkaars zeer gespecialiseerde talen te begrijpen. Als je een suggestie hebt voor een nieuwe definitie of hoe je een technische uitleg kunt verbeteren, stuur Margaret dan een…