Pystyykö Llama 3 Meta AI kilpailemaan OpenAI:n ja Googlen kanssa vuonna 2024?

Avoin toiminta
Tiivistelmä

  • Meta julkaisi seuraavan sukupolven Meta Training and Inference Acceleratorin (MTIA), joka on seuraava osa sen räätälöityjen piipiirien tuoteperhettä, joka on suunniteltu Metan tekoälyn työtehtäviin.
  • Yhtiö vahvisti, että se julkaisee kaksi versiota avoimen lähdekoodin Llama 3 large language model (LLM) -mallista ennen kuin suurempi versio julkaistaan kesällä.
  • Llama 3:n kevyet versiot voivat olla helpommin saatavilla kuin GPT-4:n kaltaiset suuremmat mallit, joten niiden kouluttaminen ja käyttäminen on halvempaa.
  • Llama 3 näyttää lupaavalta, mutta se tuskin ohittaa GPT-4:n tai Geminin lähiaikoina.

Meta julkaisi viime viikolla muutamia suuria uutisia, jotka vahvistavat sen tekoälyekosysteemin kehitystä. Organisaatio esitteli seuraavan sukupolven Meta Training and Inference Accelerator (MTIA) -piirinsä. Nämä sirut toimivat 3x paremmin kuin edellinen iteraatio, ja niiden avulla käyttäjät voivat ajaa kehittyneempiä malleja. Se myös vähentää riippuvuutta Nvidian GPU:ista.

Introducing the next generation of the Meta Training and Inference Accelerator (MTIA), the next in our family of custom-made silicon, designed for Meta’s AI workloads.

Full details ➡️ https://t.co/bF9tn4TfeJ pic.twitter.com/eti6fRCLTs

— AI at Meta (@AIatMeta) April 10, 2024

Meta vahvisti myös, että se julkaisee kaksi versiota avoimen lähdekoodin Llama 3 large language model (LLM) -mallista ennen kuin suurempi versio julkaistaan kesällä, eräs työntekijä kertoi The Information -lehdelle.

Tässä mallissa odotetaan olevan noin 140 miljardia parametria ja se tulee tehostamaan Meta AI:n Ray Ban älylasien virtuaaliassistenttia.

Metan globaaleista asioista vastaava johtaja vahvisti osan näistä tiedoista Lontoon Meta AI Day -tapahtumassa.

“Seuraavan kuukauden aikana, tai jo aikaisemmin, toivottavasti hyvin lyhyessä ajassa, toivomme voivamme julkaista uuden seuraavan sukupolven perusmallien sarjan, Llama 3:n, käyttöönoton”, Clegg sanoi. “Tämän vuoden aikana tullaan julkaisemaan useita erilaisia malleja, joilla on erilaisia ominaisuuksia ja monipuolisuuksia”.

Nämä tuoreet uutiset tulevat vain alle kuukausi sen jälkeen, kun X.AI ja Elon Musk ilmoittivat julkaisevansa Grok 1.5 LLM:n, joka lähestyy GPT-4-tason suorituskykyä.

Tässä artikkelissa Techopedia tarkastelee Meta AI:n roolia generatiivisen tekoälyn markkinoilla ja selvittää, missä vaiheessa se on ennen Llama 3:n julkaisua.

Pystyykö Meta haastamaan teköälyn kärkinimet?

Llama 3:n lanseerauksen myötä Meta valmistautuu haastamaan generatiivisen tekoälyn markkinoiden kärkinimet, kuten Anthropic, Google ja OpenAI.

“Tavoitteenamme on ajan mittaan tehdä Llamaan perustuvasta Meta AI:sta maailman hyödyllisin avustaja”, sanoo Joelle Pineau, AI-tutkimuksen varajohtaja Meta AI Day Lontoo -tapahtumassa. “Tämän saavuttamiseksi on vielä melko paljon työtä jäljellä.”

Llama 3:lla on edessään vaikea taistelu, ei pelkästään Geminin ja GPT-4:n (tai myöhemmin GPT-5:n) kykyjen vuoksi, vaan myös siksi, että generatiivisen tekoälyn markkinat ovat niin kilpaillut.

Joidenkin kommentoijien mielestä, Meta on kuitenkin hyvässä asemassa nappaamaan johtoaseman.

The AI Journalin toimitusjohtaja ja perustaja Tom Allen kertoi Techopedialle lähettämässään sähköpostiviestissä:

“Llama 3:n julkistamisen myötä, joka on tulossa tänä kesänä, laittaisin heidän joukon kärkeen.

 

“Heillä on edessään erinomainen mahdollisuus Meta Rayban -lasien kanssa, joihin on tulossa päivityksiä. Lisäksi, näillä laseilla on etulyöntiasema, koska ihmiset tietävät ja ovat jo tottuneet käyttämään Rayban -laseja. Älylasien assistantti tulee perustumaan Llama 3:seen, joka toimii näiden kanssa käsikädessä ja ne tulevat myös parantamaan muita Meta:n tulovirtoja.”

Allen korostaa myös, että Meta AI:lla on pääsy oikeisiin tietoihin sosiaalisen median sivustoilla, kuten Facebookissa ja Instagramissa, mikä tarjoaa kultakaivoksen dataa sen järjestelmien kouluttamiseen.

Toisaalta, jos otetaan huomioon, että kaksi ensimmäistä julkaistavaa Llama 3 -mallia eivät ole multimodaalisia, on epätodennäköistä, että ne syrjäyttäisivät Geminin ja GPT-4:n kaltaiset suositut mallit ainakaan lyhyellä aikavälillä, sillä ne tarjoavat tukea tekstin, kuvan ja äänen syöttämiselle.

Tästä huolimatta, Llama 3:n kevyillä versioilla on potentiaali olla tavoitettavissa helpommin, kuin GPT-4:n kaltaiset suuret mallit, tehden näistä halvempia kouluttaa ja tehokkaampia käyttää laitteille ladattavissa sovelluksissa ja pienissä laitteissa kuten älypuhelimilla.

Meta AI:n Llaman lyhyt historia

Helmikuussa 2023, Meta julkaisi Llaman neljässä eri kokoluokassa (7B, 13B, 33B, ja 65B parametrit), sai malli merkittävää huomiota koska se perustui avoimeen lähdekoodiin.

Tuohon aikaan, kun Meta:n kaltainen suuryritys investoi tehokkaaseen avoimen lähdekoodiin -malliin, suljetun “mustan laatikon” -mallin sijaan, tarjosi se paljon kaivatun vaihtoehdon OpenAI:n kaltaisten palveluntarjoajien suljetulle kehitystavalle.

Mallin pienemmät versiot merkitsivät myös sitä, että kehittäjät pystyivät kouluttamaan ja ajamaan omia mallejaan, kuluttamatta omaisuuksia tehokkaaseen laskentainfrastruktuuriin. Jokaista versiota pystyi myös optimoimaan sen suorituskyvyn parantamiseksi.

Vaikka Llama ei saavuttanut ChatGPT:n tasoista hypeä, keräsi se silti runsaasti kiinnostusta, ja Meta sai yli 100 000 pyyntöä päästä käyttämään mallia.

Llama 2:n julkaisun myötä heinäkuussa 2023 kuilu avoimen lähdekoodin ja proprietäärisen tekoälyn välillä alkoi kuitenkin kaventua.

Malli, joka oli saatavilla 7 miljardin, 13 miljardin ja 70 miljardin parametrilla, päihitti avoimen lähdekoodin mallit useimmissa testatuissa vertailuarvoissa ja herätti niin paljon huomiota, että syyskuuhun 2023 mennessä yli 3500 yritysprojektia perustui Llama 2 -malleihin.

Meta AI Llama historia lyhyesti

Miten Meta sopii LLM-markkinoille?

Vaikka Metan Llama 2 ei päihitä GPT-4:ää tai tarjoa multimodaalisia ominaisuuksia, sillä on selvä etu, koska se on kevyempi ja halvempi käyttää.

Joidenkin arvioiden mukaan, Llama 2:n kustannukset kappaleen tiivistelmää kohti ovat 30 kertaa pienemmät kuin GPT-4:n, mutta tarkkuus on sama.

Tästä huolimatta, Llama 2:n avoimen lähdekoodin luonne saattaa myös hidastaa sitä.

Toisin kuin GPT-4 tai Gemini, joita voi käyttää netissä suoraan verkkosovelluksen kautta, käyttäjien on ladattava Llama 2.

Vaikka tämä ei olekaan kohtuuttoman vaikeaa, ei käyttäjäkokemus ole yhtä saumaton kuin Geminin ja ChatGPT:n kirjoittaminen Googleen tai selaimeen.

Samoin multimodaalisten ominaisuuksien puute, tekee Geministä ja ChatGPT:stä paremmat vaihtoehdot käyttäjille, jotka haluavat olla vuorovaikutuksessa virtuaaliavustajan kanssa, joka pystyy käsittelemään teksti-, puhe-, ääni- ja kuvasyötteitä.

Jos kiinnitämme huomiomme avoimen lähdekoodin LLM-markkinoihin, huomaamme, että vaikka Llama 2 on toiminut hyvin, Mistral AI:n kaltaiset kilpailijat ovat päihittäneet sen tietyillä osa-alueilla. Esimerkiksi, Mistral 7B päihittää Llama 2:n 13B:llä kaikissa vertailuarvoissa ja Llama 1:n 34B:llä monissa vertailuarvoissa.

Toisaalta Llama 3:n julkaisu ja yhteys Ray Banin älylaseihin ovat merkittäviä villejä kortteja.

Oikein toteutettuna Metan generatiiviset tekoälyominaisuudet, antavat käyttäjille mahdollisuuden sekoittaa fyysisen ja digitaalisen maailman osana uutta multimodaalista LLM-kokemusta, ja Metan sosiaalisen median valtakunta, tarjoaa pääsyn kaikkeen tarvittavaan dataan juuri tätä varten.

Techopedian yhteenveto

Meta on edelleen tärkeä toimija LLM-markkinoilla, mutta sen ponnistelut ovat toistaiseksi keskittyneet pääasiassa avoimen lähdekoodin malliekosysteemin rikastuttamiseen.

Llama 3 näyttää lupaavalta, mutta se tuskin ohittaa tekoälymarkkinoiden kärkinimiä, kuten GPT-4 tai Geminiä lähiaikoina.

Usein kysytyt kysymykset

Mikä on Meta AI?

Mikä on Llama 2?

Milloin Llama 3 julkaistaan?

Mikä on Metan uusin tekoälymalli?

Mitä Meta tekee AI-alalla?

Voiko Meta AI generoida kuvia?

]

Samankaltaiset termit

Aiheeseen liittyvät artikkelit

Tim Keary
Technology Specialist
Tim Keary
Teknologia-asiantuntija

Tammikuusta 2017 lähtien Tim Keary on toiminut itsenäisenä teknologia-kirjoittajana ja raportoijana, käsitellen yritysteknologiaa ja tietoturvaa.