La inteligencia artificial aplicada a la generación audiovisual vuelve a dar un salto con el lanzamiento de Sora 2, el nuevo modelo de OpenAI que combina vídeo y audio con un nivel de realismo inédito hasta ahora.
La compañía, conocida por ChatGPT, apuesta ahora por una aplicación social que sitúa al usuario en el centro de la experiencia y que abre un debate sobre el futuro de la creatividad digital, la regulación y la seguridad en este ámbito.
Sora 2 representa la evolución natural de los primeros sistemas de vídeo generados por IA. Según OpenAI, su capacidad para mantener la coherencia física y visual lo convierte en un salto comparable al que supuso GPT-3.5 en el terreno del texto. Los objetos y personajes ahora conservan su estado entre planos, y los movimientos responden a patrones físicos más realistas, superando los errores habituales de versiones previas.
La novedad es que este modelo genera imágenes en movimiento, pero también audio: voces, efectos y paisajes sonoros. La integración convierte a Sora 2 en una herramienta completa para la producción de contenidos digitales, desde piezas cinematográficas hasta clips breves pensados para redes sociales.
Una aplicación diseñada para uso social
El despliegue inicial se ha realizado a través de una aplicación para iOS, disponible únicamente en Estados Unidos y Canadá y bajo invitación. En ella, los usuarios pueden grabar una breve muestra de voz y rostro para insertarse como cameo en escenas generadas por IA. La app permite además remezclar vídeos de otros y navegar por un feed adaptado mediante instrucciones en lenguaje natural, algo similar a lo que hace apenas unos días presentaba Meta con su app Vibes.
OpenAI insiste en que no busca fomentar el consumo pasivo, sino incentivar la creación colaborativa. Este planteamiento responde al auge de modelos competidores como Runway o Pika Labs, que han abierto el mercado de los vídeos generados por IA a audiencias más amplias en los últimos dos años.
El sistema incorpora múltiples capas de filtrado de contenido dañino, controles parentales integrados con ChatGPT y restricciones específicas para adolescentes
Uno de los puntos en los que OpenAI ha puesto más énfasis es en la seguridad. El sistema incorpora múltiples capas de filtrado de contenido dañino, controles parentales integrados con ChatGPT y restricciones específicas para adolescentes, como un número limitado de generaciones o mayores requisitos de consentimiento en el uso de cameos.
La compañía también ha introducido medidas de procedencia y consentimiento que permiten a los usuarios revocar el uso de su imagen, además de contar con moderadores humanos para gestionar abusos. La estrategia busca adelantarse a críticas sobre desinformación, manipulación audiovisual y posibles usos maliciosos de esta tecnología.
Un despliegue gradual con modelo freemium
Por ahora, la aplicación se ofrece de manera gratuita, con límites de uso condicionados a la capacidad de cómputo. Los suscriptores de ChatGPT Pro, con una tarifa de 200 dólares al mes, acceden a una versión de mayor calidad, y OpenAI prevé habilitar el modelo mediante API para integrarlo en servicios de terceros.
Aunque la disponibilidad está limitada a Norteamérica, la compañía ha confirmado su intención de expandir el acceso a otros mercados. No obstante, no ha concretado fechas para Europa, donde el marco regulatorio de la IA es más exigente y podría retrasar la llegada de estas funcionalidades.
Pese a los avances, OpenAI reconoce que Sora 2 no está exento de errores. En las demostraciones, escenas de acción o animación muestran fallos en la continuidad que delatan la naturaleza algorítmica del modelo. Sin embargo, la empresa sostiene que estos defectos forman parte del aprendizaje y que la experiencia ya ofrece un salto cualitativo respecto a Sora 1.