A nivel técnico, Project Genie se apoya en Genie 3, un modelo desarrollado por Google DeepMind que permite crear entornos dinámicos en tiempo real, capaces de reaccionar a las acciones del usuario durante varios minutos. A diferencia de propuestas anteriores centradas en escenas estáticas, esta tecnología introduce una experiencia más fluida y continua, en la que el entorno se construye a medida que se interactúa con él.
Para garantizar su implementación, la compañía ha combinado esta tecnología con otros sistemas propios, como la generación visual de Nano Banana y las capacidades conversacionales de Gemini, dando lugar a una herramienta que no se limita a mostrar un escenario, sino que permite recorrerlo, modificarlo y reinterpretarlo.
Cómo se construyen los mundos generados por IA
En cuando a su modus operandi, Project Genie se articula en torno a un proceso progresivo. En primer lugar, el usuario define la idea general del mundo mediante un boceto inicial, que sirve como base visual antes de su generación definitiva. A partir de ahí, el sistema crea el entorno y lo va adaptando en tiempo real en función de las decisiones y movimientos del usuario.
Por consiguiente, la experiencia no es cerrada ni lineal. Los mundos pueden explorarse libremente, pero también revisarse, ajustarse o combinarse con otros escenarios previamente generados, lo que abre la puerta a experiencias más complejas y personalizadas.
“Es emocionante llegar a un punto en el que más personas puedan acceder a esta tecnología y aportar su punto de vista”
Desde Google señalan que esta apertura busca, además, recoger impresiones de uso real. “Es emocionante llegar a un punto en el que más personas puedan acceder a esta tecnología y aportar su punto de vista”, explicó Shlomi Frutcher, director de Investigación en DeepMind, en declaraciones recogidas por medios especializados.
Acceso limitado y enfoque experimental
Por el momento, el acceso a Project Genie está restringido a los suscriptores de Google AI Ultra en Estados Unidos, con sesiones de generación y exploración limitadas a 60 segundos. Según la compañía, esta restricción responde a la necesidad de asignar recursos computacionales dedicados a cada sesión.
Cabe destacar que Google insiste en el carácter experimental del prototipo. Los mundos generados pueden no ajustarse siempre a las indicaciones del usuario, presentar inconsistencias visuales o experimentar cierta latencia durante la interacción. Aun así, la compañía considera esta fase clave para evaluar el potencial real de la tecnología.