Hvorfor oss?

9 fantastiske AI-genererte videoer laget med Sora

Tidligere denne måneden lanserte OpenAI Sora, en tekst-til-videomodell som kan lage AI-genererte videoer ut fra skriftlige instruksjoner.

Sora er i stand til å generere komplekse scener med flere karakterer og bevegelser, samtidig som den forstår hvordan detaljene i brukerens tekst eksisterer i den fysiske verdenen.

Og selv om Sora foreløpig bare er tilgjengelig for et begrenset antall red teamers, har hypen rundt selskapets evne til å skape svært realistiske og detaljerte bilder vakt stor oppmerksomhet.

Derfor bestemte vi oss for å se på noen av de beste eksemplene på verktøyet i aksjon – ni fantastiske AI-genererte videoer laget med Sora.

Dette inkluderer en gjennomgang av hva hver enkelt video gjorde riktig (og galt), og, der det er mulig, et sammendrag av den opprinnelige oppfordringen, eller ledeteksten, – kjent som “prompt” (oversatt til norsk).

Det viktigste å ta med seg

  • Techopedia tar for seg ni imponerende AI-genererte videoer som er laget med Sora, fra realistiske scener som en kvinne som går i Tokyo til mer surrealistiske scenarier som en postapokalyptisk manet i et bybilde.
  • Til tross for enkelte mangler viser disse videoene at Sora har potensial til å revolusjonere verden av AI-generert innhold.
  • Sora er ennå ikke offentlig tilgjengelig, men det finnes andre gratis AI-verktøy for videogenerering som lar deg eksperimentere med lignende teknologi.


9 av de beste AI-genererte videoene laget med Sora

1. Kvinnen i rødt

Den mest kjente AI-genererte videoen som hittil er laget med Sora, er OpenAIs reklamevideo, som viser en kvinne i skinnjakke og rød kjole som går rundt i Tokyos gater.
I videoen kan man se henne gå gjennom et pulserende bymiljø med fotgjengere som beveger seg i bakgrunnen. Alle detaljene i videoen, helt ned til små elementer som det våte gulvet, får det til å virke som om klippet er ekte.

Det eneste vi la merke til, var den unaturlige bevegelsen når hun gikk, og den uvanlige uskarpheten i bakgrunnen.

Opprinnelig prompt (ledetekst):

“En stilfull kvinne går nedover en gate i Tokyo som er fylt med varmt lysende neonlys og animerte byskilt. Hun har på seg en svart skinnjakke, en lang, rød kjole, svarte støvler og en svart veske. hun har solbriller og rød leppestift. hun går selvsikkert og avslappet. Gaten er fuktig og reflekterende, noe som skaper en speileffekt av de fargerike lysene. Mange fotgjengere går rundt.”

2. Snødekt Tokyo

Dette neste eksempelet, som også er laget og utgitt av OpenAI, viser nok en gang fotgjengere som beveger seg gjennom Tokyo City, men denne gangen er byen dekket av snø.

Den dynamiske kamerabevegelsen som følger det sentrale paret i scenen, kombinert med bevegelsene i snøfallet, trafikken i bakgrunnen og fotgjengerne, gir videoklippet en følelse av virkelighet og dybde.

Vi la imidlertid merke til noen tegn på at videoen var AI-generert. Blant annet forsvant bilene når de krysset under tregrensen, og fotgjengerne på høyre side av skjermen ble uvanlig forvrengt.

Opprinnelig prompt:

“Det er liv og røre i den vakre, snødekte byen Tokyo. Kameraet beveger seg gjennom den travle bygaten og følger flere mennesker som nyter det vakre snøværet og handler i bodene i nærheten. Vakre Sakura-blomster flyr i vinden sammen med snøfnuggene.”

3. En hund lærer seg å skrive

Et humoristisk eksempel som ble delt på X, ble delt av Justine Moore, investeringspartner i a16z, og viste en AI-generert video av en hund som skriver på et tastatur.

Dette eksemplet skilte seg ut fordi det så ekstremt realistisk ut, men det lignet mer på den typen innhold man tar opp med en smarttelefon for å dele på sosiale medier, enn på den polerte estetikken i videoer som Lady in Red.

I videoen virker den generelle bevegelsen av hundens hode og belysningen naturlig og troverdig. Det eneste som avslører at videoen er AI-generert, er den uvanlige bevegelsen av potene (og det faktum at det er en hund som skriver!).

Opprinnelig prompt:

Ikke spesifisert

4. En katt på leting etter ly

En annen video som fanget oppmerksomheten vår, ble delt av Tim Brooks, forsker ved OpenAI, og viser en katt som krysser en bakgate.

Denne videoen fanget oppmerksomheten vår, ikke bare på grunn av den ekstremt detaljerte bakgrunnen av søppel og annet rusk, men også på grunn av hvor naturtro katten ser ut og hvordan den speiler seg i sølepyttene på gulvet.

Vi la selvfølgelig merke til at bevegelsene til katten som gikk var ekstremt unaturlige – og det samme var bevegelsene til halen noen steder. Vi syntes likevel at videoen ga et troverdig bilde av et dyr som leter etter ly (selv om den ikke inkluderte regn, som var spesifisert i den opprinnelige oppgaven).

Opprinnelig prompt:

“En hvit- og oransjetabby smugkatt løper over en bakgate i et kraftig regnvær på jakt etter ly…”

5. Bil kjører gjennom flere landskap

I et innlegg på X delte AI-skaperen Bilawal Sidhu et video-til-video-eksempel på Sora i aksjon, der en video av en bil som kjører gjennom et landlig landskap, ble lagt inn i modellen og forvandlet til noe nytt.

I løpet av videoen kan man for eksempel se bilen kjøre på en landevei, før den skifter til en vinterbakgrunn, dinosaurer, en frodig jungel og til og med en surrealistisk regnbuevei.

Selv om dimensjonene på veien og bakgrunnen til tider ser unaturlige ut, viser denne videoen hvordan brukere kan ta videoer og gi dem en stilistisk overhaling.

Opprinnelig prompt:

[Videoinput av en bil som kjører nedover en landevei, ledetekster in-line]

6. Valper som leker i snøen

En annen video som fanget oppmerksomheten vår, var et av OpenAIs reklamematerialer – et kort klipp av en gruppe valper som leker i snøen.

Det som slo oss med dette bildet, var detaljnivået i bildene og hvor naturtro bevegelsene i snøen så ut.

Selvfølgelig var det noen små problemer med at snøen beveget seg unaturlig enkelte steder, og at valpen til høyre falt unaturlig langt under snølinjen i siste del av videoen, men etter hvert som maskinlæring og generative AI-teknikker blir stadig bedre, vil slike inkonsekvenser bli mindre og mindre vanlige.

Opprinnelig prompt:

Ukjent

7. En postapokalyptisk manet

I et mer surrealistisk eksempel delt av Joe Taylor, forsker ved OpenAI, ser vi en manet som beveger seg gjennom et postapokalyptisk bylandskap.

Manetens bevegelser var ganske varierte – med den typen flytende estetikk og bevegelse i tentaklene som man forventer av et virvelløst havdyr. På samme måte syntes vi også at bakgrunnen i bybildet føltes ganske autentisk.

Når det gjelder problemer med videoen, la vi først og fremst merke til at maneten så ut til å sitte foran en greenscreen i stedet for å bevege seg gjennom omgivelsene.

Opprinnelig prompt:

“En surrealistisk scene utspiller seg mens en gigantisk, gjennomskinnelig manet flyter grasiøst gjennom et øde bylandskap i skumringen. Scenen er filmet på 35 mm film.”

8. En eldre mann som spiser en hamburger

Vårt neste eksempel, denne gangen delt av en X-konto kjent som AiBot, viser et kort klipp av en eldre herre som spiser en hamburger.

Ved første øyekast ser videoen ekte ut, med mannens ansikt og cheeseburgeren som ser tydelige og naturtro ut. Bevegelsene til de andre personene i bakgrunnen gir også scenen mer dybde.

Til tross for dette la vi merke til noen uvanlige elementer i videoen. Salaten og sesamfrøene ser malplassert ut, og mannens bitt i burgeren stemmer ikke overens med effekten på brødet.

Opprinnelig prompt:

“En eldre mann med grått hår og briller fortærer en deilig cheeseburger. brødet er spekket med sesamfrø, fersk salat, en skive ost og en gyllenbrun biff. han lukker øynene mens han tar en bit. han har på seg en rød jakke og ser ut til å sitte inne på en gatekjøkkenrestaurant.”

9. “Late Night Supercar”

Til slutt, i et eksempel delt av en X-konto kjent som Global Things, kan man se en superbil kjøre gjennom regnvåte bygater.

Ved første øyekast så denne videoen ut til å være ekte, med et bymiljø i bakgrunnen som så detaljert og levende ut med naturlig belysning.

Vår eneste virkelige kritikk av videoen var at trafikken på den andre siden av veien ofte virket unaturlig, med to drosjer som dukket opp fra løse luften på slutten av videoen.

Opprinnelig prompt:

“En superbil som kjører gjennom bygater om natten med kraftig regn overalt, filmet bakfra mens bilen kjører. Selv om det våte gulvet var merkbart, fant vi ikke noe regn.

Konkludert

Alt i alt viser disse videoene at Sora har potensial til å endre spillereglene for AI-genererte videoer. Selv om programmet foreløpig ikke er offentlig tilgjengelig, viser de første videoene at det kan skape svært realistisk og oppslukende innhold.

Hvis du vil komme i gang med å bruke AI til å lage dine egne videoer, kan du begynne med å se på gratisverktøy som Runway Gen-2, Stable Video Diffusion og PixVers. Husk bare å gjøre ledeteksten så detaljert som mulig, slik at modellen genererer det innholdet du er ute etter.

Ofte stilte spørsmål

Kan kunstig intelligens generere videoer?

Er Sora AI tilgjengelig for allmennheten?

Hvordan får jeg tilgang til Sora?

Finnes det en gratis AI-videogenerator?

Relaterte begreper

Tim Keary
Teknologispesialist

Siden januar 2017 har Tim Keary vært en frilans teknologiskribent og reporter, som dekker bedriftsteknologi og informasjonssikkerhet.