OpenAI GPT-4o: Lue kaikki mitä tiedämme siitä nyt

Avoin toiminta
Tiivistelmä

  • OpenAI:n Chat-GPT 4o tuo mukanaan puhe- ja video-ominaisuudet, jotka mahdollistavat käyttäjien vuorovaikutuksen mallin kanssa äänen ja videon avulla.
  • Päivityksen tavoitteena on vähentää kitkaa ihmisten ja koneiden välillä, hyödyntämällä kehittyneitä tekoälyominaisuuksia luonnollisempien ja saumattomampien vuorovaikutusten luomiseksi.
  • GPT-4o voi käydä reaaliaikaisia keskusteluja, vastata useille puhujille samanaikaisesti ja jopa simuloida tunteita, lisäten syvyyttä ja rikkautta vuorovaikutukseen.
  • Päivitys sisältää parannuksia laadussa ja nopeudessa yli 50 kielellä sekä työpöytäversion Mac-käyttäjille.
  • OpenAI tunnustaa reaaliaikaisen äänen ja videon väärinkäytön haasteet ja korostaa työskentelevänsä sidosryhmien kanssa näiden haasteiden vastuulliseksi ratkaisemiseksi.
  • GPT-4o otetaan käyttöön vaiheittain tulevien viikkojen aikana, mukaan lukien työpöytäsovellus, alkaen Macista.

OpenAI julkaisi tänään tiedotteen Chat-GPT 4o:sta, eli GPT-4o:sta, merkittävästä päivityksestä sen suureen kielimalliin (LLM), jota käyttää yli 100 miljoonaa ihmistä maailmanlaajuisesti.

Ominaisuudet, jotka otetaan käyttöön seuraavien viikkojen aikana, tuovat puheen ja videon kaikkien käyttäjien saataville – ilmaiseksi tai maksullisesti – ja suurin huomionarvoinen seikka on, kuinka suuri ero on käyttää ääntä ja videota vuorovaikutuksessa ChatGPT-4o:n kanssa.

Muutoksien, joista OpenAI kertoi katsojille suorassa lähetyksessä, tavoitteena on “vähentää kitkaa” “ihmisten ja koneiden” välillä ja “tuoda tekoäly kaikkien ulottuville”.

Päräyttävässä demossa, teknologiajohtaja ja esittelijä Mira Murati, yhdessä ChatGPT-kehittäjien kanssa, käy reaaliaikaisia keskusteluja ChatGPT:n kanssa, pyytäen tältä iltasatua. GPT-4o kykenee jopa tekemään vitsejä eri äänillä – leikkisästä dramaattiseen ja laulavaan – OpenAI:n tutkijan Mark Chenin pyynnöstä.

Näimme video-ominaisuuksia, reaaliaikaista ääniviestintää ja simuloituja tunteita ääni-demossa.

Videon aikana, ChatGPT käy reaaliaikaisia keskusteluja insinöörien kanssa – ratkaisten matemaattisia yhtälöitä, jotka on kirjoitettu paperille puhelimen linssin edessä samalla kun käydään leikkisää reaaliaikaista keskustelua.

Katso OpenAI live-streami

OpenAI sanoo, että ominaisuudet, jotka otetaan käyttöön seuraavien viikkojen aikana, parantavat myös laatua ja nopeutta yli 50 kielellä “tuodakseen tämän kokemuksen mahdollisimman monelle ihmiselle”. Päivitys sisältää myös työpöytäversion, joka otetaan käyttöön tänään Macilla ja se on saatavilla maksullisille käyttäjille.

Tiimi puhui yliopiston opettajista, jotka tarjoavat työkaluja opiskelijoilleen, tai podcastien luojista, jotka tuottavat sisältöä käyttäjilleen, ja siitä, kuinka voit käyttää reaaliaikaisia tietoja työssäsi.

OpenAI sanoo, että GPT-4o (’o’ tarkoittaa ‘Omni’) voi vastata äänisyötteisiin jopa 232 millisekunnissa, keskimäärin 320 millisekunnissa – mikä on vastausaikana sama kuin ihmisen välisessä keskustelussa. Vaikka ominaisuudet ovat saatavilla myös ilmaisille käyttäjille, OpenAI keskusteli myös siitä, mitä on tarjolla Pro-käyttäjille, joiden käytössä on jopa viisi kertaa enemmän kapasiteettia. Muutokset koskevat myös sovellusohjelmointirajapintaa (API), jonka sanotaan olevan 2x nopeampi ja 50% halvempi.

Yksi vaikuttava ääni- ja video-ominaisuus oli se, että kaikki kolme esittelijää puhuivat ChatGPT:lle samaan aikaan – tekoäly (AI) tunnisti onnistuneesti kaikki puhujat ja vastasi heille kaikille. Jotkut käyttäjät X:ssä (ent. Twitter), vertasivat uutta ChatGPT-versiota elokuvaan “Her”, jossa kaikkitietävä tekoälykumppani oli erottamaton ihmispersoonasta. Näimme myös reaaliaikaisen käännöksen italian ja englannin välillä käyttäjän kysymyksen perusteella Twitterissä.

OpenAI ChatGPT-4o esittely
OpenAI:n teknologiajohtaja ja esittelijä Mira Murati esittelee OpenAI GPT 4-o:n

OpenAI totesi, että “GPT-4o tuo uusia haasteita reaaliaikaiselle äänelle ja reaaliaikaiselle näköhavainnolle väärinkäyttöä vastaan, ja jatkamme työskentelyä eri sidosryhmien kanssa … selvittääksemme, kuinka parhaiten tuoda nämä teknologiat maailmaan.” Ominaisuudet otetaan siis käyttöön vaiheittain tulevien viikkojen aikana, suojatoimien ollessa voimassa.

Kysyessään kommenttia, Brian Jackson, Info-Tech Research Groupin pääasiallinen tutkimusjohtaja, sanoi:

“Katsoessani OpenAI:n live-tapahtumaa tänään, huomioni on, että GPT-4o:n julkaisu edustaa sekä merkittävää päivitystä ChatGPT:n ominaisuuksiin että näkemyksiä sen liiketoimintastrategiasta. Tähän asti ChatGPT on orkestroinut useiden mallien välillä käsitelläkseen visuaalista tulkintaa, äänen analysointia ja tekstin ymmärtämistä. GPT-4o muuttaa tämän tuomalla nämä ominaisuudet natiivisti yhden yhtenäisen mallin alaiseksi.

Live demo, joka voimakkaasti muistutti vuoden 2013 Spike Jonzen elokuvaa Her, OpenAI-tiimin jäsenet kävivät reaaliaikaisen keskustelun päivitetyn mallin kanssa. Se havaitsi sujuvasti tunteita käyttäjien äänissä, keskeytti kun se keskeytettiin ja mukautti vastauksiaan sen mukaisesti, ja ymmärsi paperille piirretyn matemaattisen kysymyksen prosessoimalla näkymän älypuhelimen kameran kautta. Se on kuin superjalostettu versio Siristä tai Google Assistantista, joka lupaa mullistaa käsityksemme AI-pohjaisista henkilökohtaisista avustajista.

Mallin itsensä lisäksi, OpenAI antoi vihjeitä sen liiketoimintastrategiastaan julkaisun yhteydessä. Laskemalla uusien mallien kyselyiden kustannuksia 50% GPT-4:ään verrattuna, OpenAI sanoi, että sillä on nyt varaa tuoda uuden mallin kaikkien käyttäjien saataville, ei vain maksavien tilaajien. Tämä viittaa siihen, että OpenAI on enemmän kiinnostunut houkuttelemaan suuren määrän käyttäjiä kuin houkuttelemaan mahdollisimman monta maksavaa tilaajaa ja sitten parantamaan marginaaliaan tilaajapalvelussa.

OpenAI toi myös muita aiemmin maksullisia ominaisuuksia ilmaisten käyttäjien saataville, mukaan lukien, tiedon etsiminen internetistä ja tiedostojen lataaminen analysoitavaksi.

OpenAI käytti myös tilaisuutta viitata Custom GPT ‘kauppaansa’, joka on ollut saatavilla kuukausia. Se visioi tulevaisuuden, jossa mikro-yhteisöt muodostuvat näiden Custom GPT:iden ympärille. Esimerkiksi, professori voisi luoda Custom GPT:n opiskelijoilleen tai podcastin tekijä voisi tehdä yhden kuulijoilleen. Tämä viittaa verkostoliiketoimintamalliin, jossa ChatGPT:n käyttöä ohjaa yhtä paljon luojayhteisö kuin OpenAI:n kehittäjät itse, samalla tapaa, mikä on Applen suhde iOS-kehittäjäyhteisöön.

OpenAI sanoo, että GPT-4o:n kyselyrajoitukset ovat edelleen voimassa ilmaisille käyttäjille, joten maksullisen version käyttämiseen on edelleen kannustimia. Odottaisin, että sen uudet ominaisuudet tekevät siitä lähitulevaisuudessa todella suositun älypuhelimilla.

OpenAI sanoi blogikirjoituksessa: “Olemme käyttäneet paljon vaivaa viimeisten kahden vuoden aikana parantaakseen sen tehoja kaikilla tasoilla.

“Tutkimuksen ensimmäiset hedelmät, sallivat meidän tuoda GPT-4-tason mallin yleisön saataville paljon laajemmin. GPT-4o:n ominaisuudet otetaan käyttöön vaiheittain (pidennetyn punaisen tiimin pääsyn alkaessa tänään).

 

GPT-4o:n teksti- ja kuva -ominaisuudet otetaan käyttöön tänään ChatGPT:ssä. Tuomme GPT-4o:n ilmaisille käyttäjille, ja Plus -käyttäjät saavat 5-kertaa suuremmat viestirajat. Julkaisemme uuden Ääni -ominaisuuden ChatGPT-4o alpha versiossa, joka on saatavilla ChatGPT Plus käyttäjille tulevien viikkojen aikana.”

OpenAI valitsi hyvän päivän tälle paljon huomiota kiinnittävälle päivitykselle, juuri päivää ennen Googlen I/O -kehittäjien konferenssia, jonka odotetaan käsittelevän suuresta tekoälyä.

Samankaltaiset termit

Eddie Wrenn
Content Editor
Eddie Wrenn
Content Editor

Eddie Wrenn on raportoija ja uutisten toimittaja, joka on työskennellyt kansallisissa ja kansainvälisissä uutistoimituksissa sekä Yhdistyneessä kuningaskunnassa että Australiassa, keskittyen erityisesti pikauutisiin sekä tiede- ja teknologiauutisointiin. Hän toimii tällä hetkellä Lontoossa, Yhdistyneessä kuningaskunnassa.