Inteligencia Artificial
De ChatGPT a Sora: OpenAI lanza una herramienta que transforma texto en vídeo
Acepta instrucciones en texto y las convierte en escenas de video, realistas, con múltiples caracteres y movimientos específicos
El Periódico
Bajo la firma ‘El Periódico’ se podrán encontrar informaciones de actualidad realizadas de manera conjunta por varios miembros del equipo de última hora u otra sección, elaborada con distintas fuentes y en la que ninguna de las aportaciones sea prioritaria ni incluya una información suficientemente sustantiva como para justificar una firma concreta.
La empresa OpenAI, uno de los líderes en inteligencia artificial generativa, presentó este jueves su modelo 'Sora' que acepta instrucciones en texto y las convierte en escenas de video, realistas, con múltiples caracteres y movimientos específicos.
Según la firma, establecida en 2015 y dirigida por Sam Altman, que ha desarrollado ChatGPT y el generador de imágenes fijas DALL-E, 'Sora' es capaz de crear "escenas complejas con detalles del componente principal y el trasfondo".
La compañía también indicó que su modelo puede "entender cómo existen los objetos en el mundo físico" y tiene la capacidad de "interpretar acertadamente las instrucciones y de generar caracteres convincentes que expresan emociones vibrantes".
'Sora' es el término en japones para "cielo" y la compañía todavía no la ha puesto a disposición del público porque sigue analizándola para comprender los peligros del sistema, según indicó el diario The New York Times.
En cambio OpenAI ha compartido la tecnología con un pequeño grupo de académicos y otros investigadores externos cuya tarea es detectar las maneras en las cuales 'Sora' podría usarse con fines maliciosos.
Steven Levy, de la revista Wired, describió su experiencia cuando OpenAi le permitió ver, aunque no operar, el modelo 'Sora' en respuesta a la instrucción en texto para crear una escena de la ciudad de Tokio captada por una cámara que se mueve por las calles, sigue a algunas personas en un día con nieve.
Resultado convincente
"El resultado es una vista convincente de lo que es, sin duda, Tokio en ese momento, cuando coexisten los copos de nieve y los capullos de cerezos" escribió Levy. "La cámara virtual, colocada en un robot volador (dron), sigue a una pareja que camina por el paisaje".
La firma indica que 'Sora' permite la creación de muchos mundos, con escenas realistas o fantásticas, tridimensionales, con movimientos fluidos, y aún en las escenas que no existen en el mundo real, el modelo aplica las reglas físicas correctas.
De este modo, OpenAI, que revolucionó el emergente sector de los servicios de IA regenerativa, dispondrá de un conjunto de servicios que van desde la generación de texto, imagen estática y video.
- La nueva multa de la DGT a quien no lleve esto en el coche a partir de agosto
- Crisis en una escuela compleja de Badalona: pierde a 20 profesores de un plumazo tras el proceso de estabilización docente
- Un brote de salmonelosis en un bar de Barcelona deja al menos 22 afectados tras comer tortilla de patatas
- Un episodio de calor extremo y polvo sahariano inundará Catalunya la semana que viene
- La clave para adelgazar está en las cenas: el ingrediente secreto que te ayudará a lograrlo
- Alijo récord en el puerto de Barcelona: Incautadas cuatro toneladas de cocaína escondidas en sacos de arroz
- ¿Comes almendras todos los días? Esto es lo que pasa si comes 10
- Ascienden a 29 los afectados por salmonelosis tras comer tortilla de patatas en un bar de Barcelona y cuatro están hospitalizados