OpenAI:s projekt Strawberry (Q*): Allt vi vet hittills

Varför oss?

Utvecklingen av artificiell intelligens (AI) har gjort stora framsteg på relativt kort tid, men det finns fortfarande mycket kvar att göra. Ledande produkter som ChatGPT och Claude Sonnet erbjuder imponerande möjligheter men med betydande logiska begränsningar.

Detta börjar dock förändras. Förra veckan rapporterade Reuters att OpenAI, skaparen av ChatGPT, arbetar med ett nytt tillvägagångssätt för AI-modeller som en del av “Project Strawberry“, även känt som “Q*“, som kommer att ge stora språkmodeller (LLM) förbättrade resonemang.

Även om källan som är bekant med ärendet inte bekräftade när Strawberry skulle släppas, delade de intern dokumentation som gav några grundläggande detaljer om projektet.

Techopedia följde upp rapporten för förtydligande från OpenAI, men världens ledande AI-företag svarade inte omedelbart på förfrågningar om kommentarer.

Viktiga slutsatser om Straweberrt från OpenAI

  • Strawberry är ett internt projekt på OpenAI, enligt Reuters.
    Modellen var tidigare känd under namnet Q*.
  • OpenAI:s modell kommer enligt uppgift att ha förbättrade resonemangsfunktioner – för att kunna hantera mer komplexa flerstegsuppgifter.
  • Denna lösning skulle kunna fungera mer självständigt än befintliga LLM:er.

Vad vi vet om OpenAI:s Strawberry

För närvarande är informationen om Strawberry knapphändig, men ett av de dokument som granskats av Reuters beskriver ett projekt som använder Strawberry-modellerna för att autonomt navigera på internet för att utföra “djupgående forskning.”

Detta skulle möjliggöra för en modell att genomsöka internet, extrahera information från artiklar och annat innehåll, vilket den sedan kan använda för att kontinuerligt förbättra sitt resonemang över tid.

Det är värt att notera att en av Reuters källor noterade att Strawberry delar likheter med STaR-tekniken (Self-Taught Reasoner) som utvecklades vid Stanford 2022. Under STaR kan en modell iterativt skapa sina egna träningsdata och bli mer intelligent över tiden.

Källan hävdade också att interna dokument tyder på att OpenAI utformar Strawberry för att utföra uppgifter med lång horisont – mer komplexa uppgifter som kräver att en modell utför en serie åtgärder över tid. Att ge modellen förmågan att utföra sådana uppgifter skulle ge den större självständighet än dagens LLM:er.

Alon Yamin, medgrundare och VD för Copyleaks, berättade för Techopedia:

”OpenAI:s ”Strawberry”-projekt innebär ett betydande steg framåt för AI-kapaciteten och kan potentiellt revolutionera hur vi interagerar med generativ AI-teknik och hur den löser komplexa problem. Konsekvenserna för forskning, mjukvaruutveckling och till och med vetenskapliga upptäckter är enorma.

”Men när vi nu tar steget fullt ut måste vi fortsätta att prioritera införandet av omfattande skyddsnät. Dessa skyddsnät kommer att säkerställa att AI-framsteg som ”Strawberry” utnyttjas på ett ansvarsfullt sätt, vilket minskar potentiella risker och maximerar deras positiva inverkan på samhället.”

Varför är Strawberry viktigt?

Om informationen som rapporterats är korrekt, tyder det på att utvecklingen av OpenAI:s LLM går mot att dess AI-modeller kommer att kunna lära sig mer självständigt och utföra komplexa uppgifter i flera steg.

Modeller som använder denna metod kommer att kunna automatisera ett bredare utbud av uppgifter än dagens LLM, som kräver en hög nivå av mänsklig övervakning. Till exempel behöver användare inte bara mata in uppmaningar för att använda ChatGPT, de måste också faktagranska dess svar för att säkerställa att det inte finns några hallucinationer och felaktiga påståenden.

Detta beror på att LLM inte tänker autonomt som människor. De är tränade att lära sig mönster i mänskligt språk och förutsäga svar på grundläggande inmatningar. Som ett resultat tänker de inte på samma sätt som en människa, och de har ingen uppfattning om sunt förnuft eller logik.

Låt oss inte bli alltför exalterade än

Strawberry kommer utan tvekan att tillföra några innovationer till marknaden, men i det här skedet är det viktigt att inte bli alltför uppslukad av hypen. Före lanseringen av GPT-4o fanns det trots allt massor av rykten om en lansering av GPT-5.

Även om GPT-4o har varit ett bra multimodalt alternativ på LLM-marknaden har den inte riktigt lyckats ta sig ur mängden av andra populära språkmodeller som Claude 3 Opus/Sonnet eller Gemini när det gäller prestanda.

Med detta sagt, om Strawberry presenterar nya tekniker som kan förbättra LLMS resonemangsförmåga, kommer det att bli ett välkommet tillskott till marknaden, på samma sätt som RAG (retrieval augmented generation) och andra tekniker har varit det.

De långsiktiga konsekvenserna av Strawberry

Innan vi får bekräftelse från OpenAI, på det ena eller andra sättet, är det svårt att identifiera de långsiktiga konsekvenserna av Strawberry. Är projektet legitimt? Kan det komma att läggas på hyllan?

Men om informationen är trovärdig skulle det tyda på att LLM:er utvecklas från att vara människoassisterade till en mer autonom roll, med möjlighet att skapa sina egna träningsdatauppsättningar och utföra uppgifter med minimal assistans.

Ur ett övergripande perspektiv skulle förmågan att automatisera skapandet av träningsdata kunna minska arbetsbelastningen för AI- och maskininlärningsforskare, som vanligtvis behöver kurera datamängder. Samtidigt kommer förmågan att hantera komplexa automationer att öppna dörren för ett bredare utbud av användningsområden inom områden som mjukvaruutveckling.

Ett sådant tillvägagångssätt kan också öka riskerna. Om modellerna är mer oberoende kommer det oundvikligen att finnas mindre mänsklig tillsyn och kontroll. Detta väcker frågor om huruvida AI-genererad träningsdata och autonoma åtgärder kan hållas i linje med ansvarsfull AI-utveckling.

Strawberry skulle åtminstone kunna svara på mer komplexa frågor och skulle vara ett litet steg på OpenAI:s resa mot att utveckla artificiell allmän intelligens (AGI), en typ av AI som skulle kunna prestera i linje med mänsklig intelligens.

Slutsatsen om OpenAI:s Strawberry-projekt

Den generativa AI-berg-och-dalbanan har fortfarande många överraskningar i beredskap. För närvarande befinner vi oss i en lugn period, men det kommer inte att förbli så.

Nya möjligheter kommer att utvecklas, och de uppgifter du kommer att kunna automatisera med AI kommer oundvikligen att öka.

Relaterade nyheter

Tim Keary
Technology Writer
Tim Keary
Teknikexpert

Sedan januari 2017 har Tim Keary varit en oberoende teknikskribent och reporter som bevakar företagsteknik och cybersäkerhet.