ChatGPT

Vad är ChatGPT?

ChatGPT (Chat Generative Pre-trained Transformer) är en komplex maskininlärningsmodell som kan utföra NLG-uppgifter (natural language generation) med en så hög noggrannhet att modellen klarar ett Turingtest.

ChatGPT tränades på enorma mängder omärkta data som hämtades från internet före 2022. Modellen övervakas kontinuerligt och finjusteras för specifika språkorienterade uppgifter med ytterligare datamängder som märkts av människor.

Uppgifter som ChatGPT är utmärkt på inkluderar:

  • Ge svar på frågor;
  • Slutföra en given text eller en fras;
  • Skriva skönlitterärt och icke-fiktivt innehåll från uppmaningar;
  • Producera människoliknande chatbot-svar;
  • Generera datorkod;
  • Översätta texten från ett språk till ett annat;
  • Utföra beräkningar;
  • Sammanfatta en given text;
  • Klassificera text i olika kategorier;
  • Analysera känslor i text;
  • Generera text som sammanfattar data i tabeller och kalkylblad;
  • Svara på användarinput på ett konversationsmässigt sätt.

ChatGPT bygger på en stor språkmodell (LLM) som kallas GPT-3 (Generative Pre-trained Transformer 3). En LLM är en typ av djupt neuralt nätverk som använder miljarder parametrar och tränas med petabytes av data.

Modellen utvecklades av OpenAI, ett forskningsföretag som grundades av Elon Musk.

Techopedia förklarar ChatGPT

Tekniskt sett kan ChatGPT kategoriseras som en typ av generativ AI. När en generativ AI-modell har tränats kan den producera resultat som liknar – men inte är desamma – som träningsdata.

Hur tränades ChatGPT?

Dataforskare och maskininlärningstekniker använde semi-supervised learning för att träna ChatGPT.

Semi-supervised learning-algoritmer tränas på datamängder som är delvis märkta; vissa av datapunkterna har en etikett och andra inte. Modellen använder den märkta datan för att förutsäga resultatet av den omärkta datan.

Enligt OpenAI samlade datavetarna in den enorma mängd omärkta data som krävdes för att träna LLM genom att skrapa på internet. De kompletterade detta med textkällor som antingen var offentliga eller tillgängliga för användning av forskare och eventuellt regeringar.

OpenAI har inte avslöjat exakt hur de kunde märka de enormt stora datamängder som krävdes för att finjustera modellen, men det är känt att de outsourcade en del av märkningen, och det är troligt att de också utnyttjade crowdsourcing-plattformar som Amazons Mechanical Turk.

ChatGPT använder uppmaningar för att generera mer exakta och relevanta svar på ett brett spektrum av inmatningar och finjusteras kontinuerligt med användaruppmaningar som är relevanta för en specifik uppgift.

Processen går ut på att ge modellen en uppmaning och sedan låta den generera ett svar. Det genererade resultatet utvärderas sedan av en mänsklig utvärderare, och modellen justeras baserat på återkopplingen. Finjusteringsprocessen upprepas tills modellens resultat är acceptabelt.

Det är därför det är viktigt för användare som interagerar med ChatGPT att ge feedback på kvaliteten på modellens utdata. Genom att utvärdera modellens resultat och ge feedback kan användarna hjälpa till att finjustera modellen och bidra till dess pågående utveckling och förbättring.

ChatGPT och ansvarsfull AI

Responsible AI är ett ramverk för styrning som är avsett att göra komplexa black-box AI-modeller som ChatGPT mer förklarliga och därmed mer pålitliga. Det finns flera steg som OpenAI tar för att se till att ChatGPT stöder konceptet med ansvarsfull AI.

  • Forskare och utvecklare på OpenAI letar efter sätt att göra denna djupinlärningsmodell mer transparent och försöker vara så uppriktiga som möjligt om modellens kapacitet, begränsningar och potentiella missbruk.
  • OpenAI:s dataforskare granskar kontinuerligt feedback från användarna och har satt in människor i loopen (HITL) för att eliminera partiskhet i sina träningsdata.
  • OpenAI:s ingenjörer övervakar kontinuerligt ChatGPT:s användaruppmaningar och modellens utdata för att säkerställa att den används på ett ansvarsfullt sätt.

ChatGPT och utbildning

Den senaste versionen av ChatGPT producerar text som är så människolik att lärare har slagit larm om hur modellen missbrukas av elever. Som svar på detta har vissa skolor helt förbjudit ChatGPT. Andra testar plagieringsverktyg som är utformade för att statistiskt identifiera modellernas språkliga vattenmärken.

OpenAi, till exempel, erbjuder för närvarande sina medlemmar ett gratis plagiatverktyg som heter AI classifier. Enligt OpenAI:s webbplats fungerar dock verktyget bäst när innehållet som utvärderas för originalitet har minst 250 ord och är skrivet av en vuxen som talar engelska.

Förespråkare av ChatGPT i klassrummet ser värdet i antiplagieringsverktygen men hävdar också att denna typ av artificiell intelligens (AI) inte kommer att försvinna. Istället för att förbjuda användningen bör eleverna få lära sig hur man använder verktyget på ett etiskt sätt, och lärare bör använda denna typ av AI för att lära ut kritiskt tänkande.

Företagsanvändningar för ChatGPT

ChatGPT används som ett augmented intelligence-verktyg för en mängd olika affärsuppgifter. Det används för närvarande för att:

  • Automatisera processen för att skapa innehåll för inlägg på sociala medier, artiklar på webbplatser och produktbeskrivningar;
  • Bygga chatbots för kundkontakt som kan gå utanför manus;
    Sammanfatta och kategorisera kundfeedback från flera kanaler;
  • Översätta affärsrapporter och marknadsföringsmaterial från ett språk till ett annat;
  • Skriva standarddatakod och generiska skript;
  • Översätta informationen i en tabell eller ett kalkylblad till text;
  • Skapa chatbots som stöder just-in-time-lärande för interna utbildningsprogram;
  • Skriva metabeskrivningar och föreslå synonymer för SEO-nyckelord.

ChatGPT konkurrenter

Google Bard – en AI-tjänst för konversation som ger korrekta och aktuella svar på frågor genom att samla information från internet. Den särskiljande egenskapen hos BARD är att den kan har tillgång till aktuell information från internet, medan ChatGPT endast har tillgång till information som publicerats fram till 2022.

Facebook Blender – en stor språkmodell som utvecklats av Facebook AI. Blender kan utföra en mängd olika språkuppgifter, inklusive att svara på frågor, generera text och sammanfatta långa dokument.

Relaterade termer

Margaret Rouse

Margaret Rouse är en prisbelönt teknisk skribent och lärare som är känd för sin förmåga att förklara komplexa tekniska ämnen för en icke-teknisk affärspublik. Under de senaste tjugo åren har hennes förklaringar publicerats på TechTargets webbplatser och hon har citerats som en auktoritet i artiklar av New York Times, Time Magazine, USA Today, ZDNet, PC Magazine och Discovery Magazine.Margarets idé om en rolig dag är att hjälpa IT- och affärsproffs att lära sig tala varandras högt specialiserade språk. Om du har ett förslag på en ny definition eller hur man kan förbättra en teknisk förklaring, vänligen maila Margaret eller kontakta…