La compañía que lidera Sam Altman y creadora de herramientas como ChatGPT y DALL-E, entre otras, entra ahora en el negocio del vídeo con Sora que puede desarrollar “escenas complejas con detalles del componente principal y el trasfondo”, según explican.
“Estamos enseñando a la IA a comprender y a simular el mundo físico en movimiento, con el objetivo de desarrollar modelos que ayuden a la gente a resolver problemas que requieren interacción en el mundo real”, apuntan.
Este modelo es capaz de “entender cómo existen los objetos en el mundo físico” y tiene la capacidad de “interpretar acertadamente las instrucciones y de generar caracteres convincentes que expresan emociones vibrantes”.
Por el momento, esta herramienta no está disponible para el gran público ya que la compañía aún está analizando y comprendiendo los posibles peligros del sistema, como el fenómeno de los deep fakes, aunque ya la ha compartido con un grupo de académicos reducido y varios investigadores externos para analizar precisamente las maneras en las que Sora podría usarse con fines maliciosos.
Sora permite crear mundos con escenas realistas o fantásticas, tridimensionales con movimientos fluidos y escenas que no existen en el mundo real, aplicando de manera correcta las reglas físicas.