Wat is Retrieval-Augmented Generation (RAG)?
RAG staat voor Retrieval-Augmented Generation, een AI-ontwikkelingstechniek waarbij een groot taalmodel (LLM) wordt verbonden met een externe kennisbank om de nauwkeurigheid en kwaliteit van zijn antwoorden te verbeteren.
De soorten bronnen waarmee LLM’s verbinding kunnen maken met RAG zijn onder andere documentopslagplaatsen, bestanden, API’s en databases.
Techopedia legt uit wat RAG betekent
LLM’s gebruiken Retrieval Augmented Generation om informatie uit een externe kennisbank te kunnen halen. Hierdoor krijgt het model toegang tot actuele, domein-specifieke informatie, waarnaar het kan verwijzen wanneer het in realtime reageert op gebruikersvragen.
Een van de belangrijkste voordelen van deze aanpak is dat de kennis van het model niet beperkt is tot trainingsgegevens met een bepaalde einddatum. De kennisbank kan ook worden bijgewerkt zonder dat het model opnieuw hoeft te worden getraind.
Toegang tot een externe bron vermindert de kans op AI-hallucinaties, waarbij een LLM verifieerbaar onjuiste of onware uitvoer produceert. Tegelijkertijd maakt de duidelijke link naar een kennisbank het voor gebruikers makkelijker om de bronnen van de beweringen van de chatbot te bekijken en te fact-checken.
Nu we een definitie hebben uitgelegd voor het genereren van een retrieval augment, laten we eens kijken hoe het werkt.
Hoe werkt Retrieval-Augmented Generation?
Op een hoog niveau heeft RAG twee hoofdfasen: een ophaalfase en een fase voor het genereren van inhoud.
Tijdens de ophaalfase maakt een machine learning (ML) algoritme gebruik van natuurlijke taalverwerking (NLP) van de prompt van de gebruiker en gebruikt dit om relevante informatie uit de kennisbank te identificeren.
Deze informatie wordt vervolgens doorgestuurd naar een generatormodel of LLM, dat de prompt van de gebruiker en de gegevens die tijdens de ophaalfase zijn verzameld, gebruikt om een relevant antwoord te genereren dat overeenkomt met de oorspronkelijke prompt-intentie. Het proces is gebaseerd op natuurlijke taalgeneratie (NLG).
Geschiedenis van RAG
De term Retrieval Augmented Generation werd oorspronkelijk bedacht in een onderzoekspaper met de titel Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks, opgesteld door onderzoekers van Facebook AI Research, University College London en New York University.
Deze paper introduceerde het concept van RAG en schetste hoe het gebruikt zou kunnen worden in taalgeneratie taken om meer specifieke en accurate output te produceren.
Dit werk biedt verschillende positieve maatschappelijke voordelen ten opzichte van eerder werk: het feit dat het sterker gegrond is in echte feitelijke kennis (in dit geval Wikipedia) zorgt ervoor dat het minder ‘hallucineert’, met meer feitelijke generaties als resultaat, en biedt meer controle en interpreteerbaarheid,” aldus het paper.
Daarnaast merkte het onderzoek op dat “RAG kan worden gebruikt in een breed scala aan scenario’s met direct voordeel voor de samenleving, bijvoorbeeld door het te begiftigen met een medische index en het open-domein vragen te stellen over dat onderwerp, of door mensen te helpen effectiever te zijn in hun werk”.
RAG architectuur
De RAG architectuur heeft een aantal kerncomponenten die het mogelijk maken om te functioneren. Deze zijn als volgt:
Gebruik van RAG
RAG biedt veel potentiële gebruiksmogelijkheden voor bedrijven. Hieronder bekijken we enkele van de belangrijkste:
- Documentonderzoek assistenten bouwen: Met behulp van RAG kunnen organisaties chatbots bouwen die werknemers kunnen gebruiken om gegevens op te vragen die zijn opgeslagen in bedrijfsdocumenten. Dit is handig voor het beantwoorden van technische vragen over HR, compliance en beveiligingsonderwerpen.
- Klantenondersteuning: Bedrijven kunnen RAG ook gebruiken om chatbots voor klantenondersteuning te maken die gebruikers toegang geven tot meer accurate en betrouwbare informatie. Een detailhandelaar kan bijvoorbeeld een chatbot ontwikkelen die vragen van gebruikers over het leverings- en retourbeleid beantwoordt.
- Inhoud genereren: Marketeers kunnen RAG gebruiken om domeinspecifieke LLM’s te bouwen die content kunnen creëren, zoals artikelen, blogposts en nieuwsbrieven, die zijn afgestemd op de behoeften van een bepaalde doelgroep.
- Marktanalyse: Beslissers kunnen taalmodellen met RAG ook gebruiken om marktanalyserapporten te maken. De gebruiker kan bijvoorbeeld marktgegevens en sectorrapporten toevoegen aan een kennisbank en vervolgens een chatbot vragen om de belangrijkste trends samen te vatten.
- Begeleiding in de gezondheidszorg: Zorgverleners kunnen RAG gebruiken om chatbots te bouwen die patiënten toegang kunnen geven tot medische informatie en ondersteuning. Dit kan helpen om 24/7 patiëntenzorg te bieden wanneer een arts niet beschikbaar is.
RAG Uitdagingen
Hoewel RAG een zeer nuttige benadering is voor AI-ontwikkeling, is het niet perfect. Misschien wel de grootste uitdaging bij het gebruik van RAG is dat een developer een uitgebreide kennisbank moet opbouwen met inhoud van hoge kwaliteit als referentie.
Dit is een moeilijk proces omdat de gegevens zorgvuldig moeten worden gecureerd. Als de kwaliteit van de invoergegevens laag is, zal dit de nauwkeurigheid en betrouwbaarheid van de uitvoer negatief beïnvloeden.
Ook moeten developers nagaan of de kennisbank vooroordelen of vertekeningen bevat die moeten worden aangepakt.
Tot slot, hoewel RAG kan helpen om de betrouwbaarheid te vergroten, kan het de risico’s van AI-hallucinaties niet volledig wegnemen, dus eindgebruikers moeten nog steeds voorzichtig zijn met het vertrouwen van de output.
Voor- en nadelen van Retrieval-Augmented Generation
Als techniek biedt RAG organisaties een breed scala aan voor- en nadelen. Hieronder bekijken we enkele van de belangrijkste voor- en nadelen.
Voordelen
- Verbinding maken met een domeinspecifieke kennisbank zorgt voor nauwkeuriger informatie ophalen en vermindert verkeerde informatie
- Het bijwerken van de kennisbank in plaats van het opnieuw trainen van het model bespaart tijd en geld voor ontwikkelaars
- Gebruikers krijgen toegang tot citaten en referenties, waardoor ze gemakkelijk feiten kunnen controleren
- Domeinspecifieke outputs voldoen beter aan de gespecialiseerde behoeften van gebruikers
Nadelen
- Zonder gegevens van hoge kwaliteit kan de uitvoerkwaliteit eronder lijden
- Het opbouwen van een substantiële kennisbank vergt veel tijd en organisatie
- Vertekeningen in trainingsgegevens kunnen de uitvoer beïnvloeden
- Zelfs met verbeterde nauwkeurigheid blijft er een risico op hallucinaties
Conclusie
RAG is een waardevolle technologie om de kernmogelijkheden van een LLM uit te breiden. Met de juiste kennisbank kan een ontwikkelaar gebruikers toegang geven tot een hoop domein-specifieke kennis.
Dat gezegd hebbende, moeten gebruikers nog steeds proactief de output controleren op hallucinaties en andere fouten om verkeerde informatie te voorkomen.