Onlangs heeft kunstmatige intelligentie (AI) opmerkelijke vooruitgang geboekt op het gebied van natuurlijke taalverwerking, ofwel Natural Language Processing (NLP). Dit is voornamelijk te danken aan het vermogen om grootschalige modellen te trainen met behulp van tekstuele gegevens. Met de ontwikkeling van deze taalmodellen wordt AI bedreven in taken als sentimentanalyse, automatische vertaling, tekstgeneratie en samenvatting.
Ondanks deze vooruitgang blijft AI echter worstelen met zijn cognitieve vaardigheden als het aankomt op het aanpakken van redeneertaken die uit meerdere stappen bestaan, zoals wiskundige woordproblemen en symbolisch en gezond verstand redeneren.
Dit artikel introduceert de nieuwste ontwikkeling die bekend staat als Chain-of-Thought (CoT) redeneren, een op een promp-based techniek waarmee AI-modellen cognitieve vaardigheden kunnen laten zien.
Wat is een prompt?
De prompt is een instructie voor het model om een antwoord te genereren. Het is vergelijkbaar met iemand vragen om een opstel te schrijven over een specifiek onderwerp. Net als menselijke schrijvers gebruiken AI-modellen prompts als basis voor het schrijven van essays of het genereren van reacties.
We kunnen taalmodellen zoals ChatGPT eenvoudige vragen stellen zoals “Wie is de koning van het Verenigd Koninkrijk?” tot complexe problemen met gedetailleerde taakomschrijvingen. Zelfs een verzoek als “Vertel me een mop” kan worden gezien als een open prompt.
Hoe werkt Prompt Engineering?
Prompt engineering houdt zich bezig met het creëren en ontwerpen van prompts waarmee AI-modellen specifieke taken kunnen uitvoeren. Tijdens dit proces is het cruciaal om de gegevens en het formaat van de prompt zorgvuldig te kiezen om ervoor te zorgen dat het model deze effectief kan gebruiken om de taak uit te voeren.
Als we bijvoorbeeld het sentiment van de filmrecensie “Kijk er niet naar” willen bepalen, kunnen we de prompt “Het is” toevoegen aan de zin, waardoor het “Kijk er niet naar. Het is ____.” In dit geval verwachten we een hogere waarschijnlijkheid van het taalmodel om “verschrikkelijk” te genereren in plaats van “geweldig”.
Het doel van AI prompt engineering is om prompts van hoge kwaliteit te genereren, zodat het AI-model nauwkeurige voorspellingen kan doen.
Leren op basis van prompts
De prompts kunnen ook worden gebruikt om een AI-model te leren de gewenste resultaten te produceren. Deze techniek, die bekend staat als prompt-based learning, houdt in dat we het model vragen en de juiste antwoorden geven voordat we het model vragen om andere vragen te beantwoorden.
We kunnen het model bijvoorbeeld een aantal numerieke vragen en de antwoorden daarop geven en het vervolgens vragen om andere vragen op te lossen:
V: De kantine heeft 23 appels. Als ze 20 appels gebruiken om de lunch te maken en ze kopen er nog 6 appels bij, hoeveel appels hebben ze dan?
A: 9Q: Er zijn 15 leerlingen in een klas. Als er 7 leerlingen bijkomen in de klas, hoeveel leerlingen zijn er dan in totaal? A: ______ |
Het is echter opgevallen dat eenvoudige aanwijzingen, bestaande uit alleen een vraag en het antwoord daarop, vaak leiden tot onjuiste resultaten in cognitieve taken zoals wiskundige woordproblemen, symbolisch redeneren en gezond verstand redeneren.
Om deze uitdagingen aan te pakken, is chain-of-thought reasoning een veelbelovende nieuwe techniek die speciaal ontworpen is om AI-modellen in staat te stellen deze cognitieve taken met succes aan te pakken.
Chain-of-Thought redeneren
Bij standaard prompting leert het model van vraag-antwoord voorbeelden en voorspelt dan antwoorden voor nieuwe vragen. Bij chain-of-thought prompting daarentegen wordt het model geïnstrueerd om complexe problemen in kleinere stappen op te delen en zowel de tussenliggende redeneerstappen als de uiteindelijke oplossing te geven.
Chain-of-thought is geïnspireerd op rekenkundig redeneren, waarbij natuurlijke taalredeneringen worden gebruikt om een argument op te bouwen dat leidt tot het uiteindelijke antwoord. Dit helpt het model om problemen met meerdere stappen effectiever aan te pakken, omdat het model gecompliceerde problemen kan opsplitsen in kleinere, overzichtelijke stappen die eenvoudig kunnen worden opgelost.
Omdat chain-of-thought gebaseerd is op taal, kan het worden toegepast op elke taak die een persoon met behulp van taal kan oplossen. Hieronder staat een voorbeeld van een standaard prompt versus een chain-of-thought prompt.
Voorbeeld van een standaard prompt | Voorbeeld van een chain-of-thought prompt | |
Vraag | Stel je voor dat je een roadtrip plant met je vrienden. Je wilt de totale brandstofkosten voor de reis berekenen. De afstand tussen het vertrekpunt en de bestemming is 500 km en de gemiddelde brandstofefficiëntie van je auto is 20 km per liter. De huidige brandstofprijs is € 1,90 per liter. Bereken de geschatte totale brandstofkosten voor de reis. | Stel je voor dat je een roadtrip plant met je vrienden. Je wilt de totale brandstofkosten voor de reis berekenen. De afstand tussen het vertrekpunt en de bestemming is 500 km en de gemiddelde brandstofefficiëntie van je auto is 20 km per liter. De huidige brandstofprijs is € 1,90 per liter. Bereken de geschatte totale brandstofkosten voor de reis.
|
Antwoord | Antwoord: € 38. |
|
Voordelen van de Chain-of-Thought-techniek
Chain-of-thought biedt verschillende voordelen als het gaat om het verbeteren van de cognitieve vaardigheden van AI-modellen:
- Probleemdecompositie: Chain-of-thought stelt AI modellen in staat om ingewikkelde problemen op te splitsen in eenvoudig te hanteren tussenstappen, waardoor ze complexe redeneerproblemen met meerdere stappen kunnen oplossen.
- Modelinterpretatie: Door het AI-model in staat te stellen om tussenliggende redeneerstappen met oplossingen te genereren, biedt een chain-of-thought ons een manier om het gedrag van het model te interpreteren; hoe het model tot een bepaalde oplossing is gekomen. Hierdoor kunnen we potentiële fouten in het redeneerpad identificeren en opsporen.
- Brede toepasbaarheid: Chain-of-thought redeneren blijkt nuttig te zijn voor verschillende taken, waaronder wiskundige woordproblemen, gezond verstand redeneren en symbolische manipulatie. In essentie kan het worden toegepast op elke taak die mensen kunnen oplossen met behulp van taal, waardoor het een veelzijdige benadering is.
- Eenvoudige integratie: Chain-of-thought redeneren kan gemakkelijk geïntegreerd worden in de bestaande taalgebaseerde AI-modellen. Er zijn geen extra computerbronnen nodig om de modellen opnieuw te trainen of af te stemmen. Het enige wat nodig is, zijn enkele chain-of-thought voorbeelden die het model instrueren hoe de problemen op te splitsen.
Er is aangetoond dat het gebruik van chain-of-thought redeneren de cognitieve vaardigheden van AI-modellen op de hieronder genoemde gebieden effectief verbetert.
Rekenkundig redeneren is een cognitieve vaardigheid die betrekking heeft op de vaardigheid om wiskundige woordproblemen op te lossen door berekeningen in meerdere stappen uit te voeren. Deze vaardigheid helpt leerlingen bij het ontwikkelen van probleemoplossende strategieën die nodig zijn om wiskundige problemen op te lossen. De onderzoekers hebben aangetoond dat chain-of-thought AI-modellen helpt om deze cognitieve vaardigheid te leren.
Commonsense redeneren is een cruciale cognitieve vaardigheid die te maken heeft met het beantwoorden van vragen over alledaagse scenario’s door conclusies te trekken uit algemene kennis. Wetenschappers hebben vastgesteld dat chain-of-thought AI-modellen in staat stelt om deze vaardigheid te incorporeren, waardoor ze alledaagse situaties kunnen begrijpen.
Symbolisch redeneren is een fundamentele cognitieve vaardigheid die het manipuleren en evalueren van symbolische uitdrukkingen inhoudt. Onderzoekers hebben gerapporteerd dat chain-of-thought AI-modellen deze vaardigheid geeft, waardoor ze effectief symbolisch kunnen redeneren in verschillende domeinen.
De conclusie
Chain-of-thought is een veelbelovende aanpak om de cognitieve vaardigheden van AI-modellen te verbeteren, vooral op het gebied van rekenkundig redeneren, redeneren met gezond verstand en symbolisch redeneren.
In tegenstelling tot een eenvoudige prompt, instrueert een chain-of-thought prompt het model om complexe problemen op te splitsen in kleinere stappen om tussenliggende redeneringen te produceren samen met de uiteindelijke oplossing.
Chain-of-thought lost niet alleen cognitieve taken op, maar geeft ook inzicht in de innerlijke werking van het model. Het kan ook gemakkelijk worden ingezet voor verschillende taken, zonder dat er extra rekenkracht nodig is.
Door chain-of-thought redeneringen verder te onderzoeken en te verfijnen, kunnen we AI-modellen in staat stellen om effectief verbeterde cognitieve vaardigheden aan te tonen.