A principios de este mes, OpenAI anunció el lanzamiento de Sora, un modelo de conversión de texto a vídeo capaz de crear vídeos generados por inteligencia artificial a partir de instrucciones escritas.
Sora es capaz de generar escenas complejas con múltiples personajes y movimiento, al tiempo que comprende cómo los detalles de las instrucciones del usuario existen en su mundo físico.
Aunque por el momento Sora sólo está disponible para un número selecto de miembros del equipo rojo, su capacidad para crear imágenes muy realistas y detalladas ha suscitado un gran interés.
Por ello, hemos decidido echar un vistazo a algunos de los mejores ejemplos de la herramienta en acción: nueve impresionantes vídeos generados por IA y realizados con Sora.
Aquí se incluye una revisión de lo que cada vídeo hizo bien (y mal) y, en la medida de lo posible, un resumen del mensaje original.
Puntos clave
- Techopedia explora nueve impresionantes vídeos generados por IA y creados con Sora, desde representaciones de escenas realistas, como una mujer caminando por Tokio, hasta escenarios más surrealistas, como una medusa postapocalíptica en un paisaje urbano.
- A pesar de algunas imperfecciones, estos vídeos muestran el potencial de Sora para revolucionar el mundo de los contenidos generados por IA.
- Sora aún no está disponible públicamente, aunque otras herramientas gratuitas de generación de vídeos de IA te permiten experimentar con una tecnología similar.
9 de los mejores vídeos generados por IA con Sora
1. La Dama de Rojo
Podría decirse que el vídeo generado por IA más conocido generado con Sora hasta ahora es el vídeo promocional de OpenAI, que muestra a una mujer con una chaqueta de cuero y un vestido rojo caminando por las calles de Tokio, Japón.
Durante el vídeo, se la puede ver caminando por un vibrante entorno urbano con peatones moviéndose en el fondo. El detalle general del vídeo, hasta los pequeños elementos como el suelo mojado, hace que parezca que el clip es real.
Las únicas pistas reales que notamos fueron el movimiento antinatural al caminar y el inusual desenfoque del fondo.
Prompt original:
«Una mujer elegante camina por una calle de Tokio llena de cálidos neones brillantes y animados letreros de la ciudad. Lleva una chaqueta de cuero negro, un vestido largo rojo y botas negras, y lleva un bolso negro. lleva gafas de sol y pintalabios rojo. camina confiada y despreocupadamente. La calle está húmeda y es reflectante, lo que crea un efecto espejo de las luces de colores. Muchos peatones pasean».
2. Ciudad de Tokio nevada
Este siguiente ejemplo, también creado y publicado por OpenAI, muestra de nuevo a peatones moviéndose por la ciudad de Tokio, pero esta vez está cubierta de nieve.
El movimiento dinámico de la cámara siguiendo a la pareja central de la escena, combinado con el movimiento de la nevada, el tráfico de fondo y los peatones, da al videoclip una sensación de realismo y profundidad.
Sin embargo, observamos algunos indicios de que el vídeo estaba generado por IA. Por ejemplo, que los coches desaparecen al cruzar bajo la línea de árboles y una distorsión inusual de los peatones a la derecha de la pantalla.
Prompt original:
«La hermosa y nevada ciudad de Tokio está bulliciosa. La cámara se mueve por la bulliciosa calle de la ciudad, siguiendo a varias personas que disfrutan del hermoso tiempo nevado y compran en los puestos cercanos. Preciosos pétalos de Sakura vuelan por el viento junto con los copos de nieve».
Introducing Sora, our text-to-video model.
Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W
Prompt: “Beautiful, snowy… pic.twitter.com/ruTEWn87vf
— OpenAI (@OpenAI) February 15, 2024
3. Un perro aprende a escribir
Justine Moore, socia inversora de a16z, compartió un divertido ejemplo en X, que mostraba un vídeo generado por IA de un perro escribiendo en un teclado.
Este ejemplo destacaba porque parecía extremadamente realista, pero más parecido al tipo de contenido que se filmaría con un smartphone para compartirlo en las redes sociales que a la estética tan pulida que presentan vídeos como el de la Dama de Rojo.
En el vídeo, el movimiento general de la cabeza del perro y la iluminación parecen naturales y creíbles. El único indicio real de que el vídeo está generado por IA es el movimiento inusual de las patas (¡y el hecho de que un perro esté escribiendo!).
Prompt original:
No especificado
I’ve seen a lot of AI video, but this clip feels like the tipping point.
Definitely the most impressive Sora generation I’ve seen yet, it would fool me scrolling through a feed…
(posted by OpenAI on TikTok) pic.twitter.com/cthc2IIEWU
— Justine Moore (@venturetwins) February 20, 2024
4. Un gato en busca de refugio
Otro vídeo que nos llamó la atención fue el compartido por Tim Brooks, investigador científico de OpenAI, que mostraba a un gato atravesando un callejón.
Este vídeo nos llamó la atención no sólo por el fondo extremadamente detallado de basura y otros desechos, sino también por lo realista que parece el gato y su reflejo en los charcos del suelo.
Por supuesto, nos dimos cuenta de que el movimiento del gato al andar era extremadamente antinatural, al igual que el movimiento de la cola en algunas partes. En cualquier caso, nos pareció que el vídeo creaba una imagen creíble de un animal buscando refugio (aunque no incluyera la lluvia, que se especificaba en el mensaje original).
Prompt original:
“Un gato callejero atigrado blanco y naranja es visto corriendo por un callejón de una callejuela bajo una fuerte lluvia, buscando refugio…”
someone plz adopt this cat 😭
“a white and orange tabby alley cat is seen darting across a back street alley in a heavy rain, looking for shelter…” (prompt by Chad Nelson)
Video generated by Sora pic.twitter.com/u0U8nfqcQP
— Tim Brooks (@_tim_brooks) February 17, 2024
5. El coche recorre múltiples paisajes
En un post en X, el creador de la IA, Bilawal Sidhu, compartió un ejemplo de vídeo a vídeo de Sora en acción, en el que un vídeo de un coche atravesando un paisaje rural se introducía en el modelo y se transformaba en algo nuevo.
Por ejemplo, a lo largo del vídeo, se puede ver al coche recorriendo carreteras rurales antes de cambiar a un fondo invernal, añadir dinosaurios, cambiar a un exuberante escenario selvático e incluso a una surrealista carretera arco iris.
Aunque las dimensiones de la carretera y el fondo parecen poco naturales en algunos puntos, este vídeo pone de relieve cómo los usuarios pueden tomar vídeos y darles una revisión estilística.
OpenAI just dropped their Sora research paper.
As expected, the video-to-video results are flipping spectacular 🪄
A few other gems: pic.twitter.com/MiRe2IYkcI
— Bilawal Sidhu (@bilawalsidhu) February 16, 2024
Mensaje original:
[Video input of a car driving down a country road, prompts in-line]6. Cachorros jugando en la nieve
Otro vídeo que captó nuestra atención fue uno de los materiales promocionales de OpenAI: un breve clip de un grupo de cachorros jugando en la nieve.
Lo que nos llamó la atención de esta imagen fue el nivel de detalle de las tomas y lo realista que parecía el movimiento de la nieve.
Por supuesto, había algunos pequeños problemas, como que la nieve se movía de forma poco natural en algunos lugares y que el cachorro de la derecha caía de forma poco natural por debajo de la línea de nieve en la última parte del vídeo, pero a medida que sigan avanzando las técnicas de aprendizaje automático y de IA generativa, estas incoherencias serán cada vez menos frecuentes.
Prompt original:
Desconocido
13/ Sora text-to-video video previews have left me speechless. pic.twitter.com/rQi7OYumx6
— Barsee 🐶 (@heyBarsee) February 16, 2024
7. Una medusa postapocalíptica
En un ejemplo más surrealista compartido por Joe Taylor, investigador de OpenAI, podemos ver una medusa moviéndose por un paisaje urbano postapocalíptico.
El movimiento de la medusa era bastante variado, con el tipo de estética líquida y movimiento en los tentáculos que cabría esperar de un invertebrado marino. Asimismo, el fondo del paisaje urbano nos pareció bastante auténtico.
En cuanto a los problemas del vídeo, lo principal que observamos fue que la medusa parecía estar sentada delante de una pantalla verde en lugar de moverse realmente por el entorno.
Mensaje original:
«Una escena surrealista se desarrolla mientras una medusa gigante y translúcida flota graciosamente a través de un paisaje urbano desierto al anochecer. La escena está rodada en película de 35 mm».
Going to share a few videos I made with Sora today.
Video generated by #Sora pic.twitter.com/X1zUXWZUgv
— 💀 Joe Taylor 💀 (@JMT3) February 24, 2024
8. Un anciano comiendo una hamburguesa
Nuestro siguiente ejemplo, esta vez compartido por una cuenta X conocida como AiBot, ofrece un breve clip de un anciano comiéndose una hamburguesa.
A primera vista, el vídeo parece real, ya que la cara del hombre y la hamburguesa parecen distintas y reales. El movimiento de otras personas representadas en el fondo también da más profundidad a la escena.
A pesar de ello, observamos algunos elementos inusuales en el vídeo. La lechuga y las semillas de sésamo parecen fuera de lugar, y el mordisco del hombre a la hamburguesa no concuerda con el efecto del pan.
Prompt original:
«Un hombre mayor con pelo canoso y gafas devora una deliciosa hamburguesa con queso. el bollo está moteado con semillas de sésamo, lechuga fresca, una loncha de queso y una hamburguesa de ternera dorada. tiene los ojos cerrados de placer mientras da un bocado. lleva una chaqueta roja y parece estar sentado dentro de un restaurante de comida rápida».
New Sora videos:
Prompt: “an older man with gray hair and glasses devours a delicious cheese burger. the bun is speckled with sesame seeds, fresh lettuce, a slice of cheese, and a golden brown beef patty. his eyes are closed in enjoyment as he takes a bite. he wears a red jacket… pic.twitter.com/QK8YyyS7ac
— AiBot (@Aibot_App) February 28, 2024
9. Supercoche nocturno
Por último, en un ejemplo compartido por una cuenta X conocida como Global Things, se puede ver un supercoche circulando por las calles de una ciudad empapadas por la lluvia.
A primera vista, este vídeo parecía real, con un entorno urbano de fondo que parecía detallado y vivido con iluminación natural.
Nuestra única crítica real al vídeo fue que el tráfico al otro lado de la carretera a menudo parecía poco natural, con dos taxis que aparecían de la nada al final del vídeo.
Pregunta original:
«Un supercoche conduciendo por las calles de la ciudad de noche con una fuerte lluvia por todas partes, fotografiado desde detrás del coche mientras conduce. Aunque se notaba el suelo mojado, nos pareció que no llovía.
Generated by new sora Ai text to video model :-
Prompt : A super car driving through city streets at night with heavy rain
everywhere, shot from behind the car as it drives pic.twitter.com/R9jBRUgKAy— Global thing’s (@Globalthings12) February 28, 2024
Conclusión
En conjunto, estos vídeos ponen de manifiesto que Sora tiene potencial para cambiar las reglas del juego en el mundo de los vídeos generados por IA. Aunque de momento no está disponible públicamente, los primeros vídeos han demostrado que puede crear contenidos muy realistas y envolventes.
Si quieres empezar a utilizar la IA para crear tus propios vídeos, puedes empezar echando un vistazo a herramientas gratuitas como Runway Gen-2, Stable Video Diffusion y PixVers. Sólo recuerda hacer tu indicación lo más detallada posible para que el modelo genere el contenido que buscas.
Preguntas frecuentes
¿Puede la IA generar vídeos?
¿Está abierta al público la IA de Sora?
¿Cómo puedo acceder a Sora?
¿Existe un generador de vídeos de IA gratuito?