Google DeepMind obre al públic el seu primer prototip per crear i explorar mons infinits que es generen en temps real.
La creació de mons virtuals ha estat durant dècades un terreny dominat pel videojoc, l’animació i la simulació científica. Avui, però, aquest territori comença a redefinir-se amb la irrupció dels anomenats world models: sistemes d’intel·ligència artificial capaços de simular entorns complets, predir-ne l’evolució i reaccionar a les accions de l’usuari. En aquest context s’inscriu Project Genie, un prototip experimental presentat per Google DeepMind que permet crear, explorar i remezclar mons interactius generats per IA.
L’accés, per ara limitat als subscriptors de Google AI Ultra als Estats Units, marca un punt d’inflexió: per primera vegada, un model de món desenvolupat en l’àmbit de la recerca avançada s’obre a l’experimentació directa dels usuaris. No es tracta d’una demo tancada ni d’una experiència estàtica, sinó d’un sistema que genera l’entorn en temps real a mesura que l’usuari avança, observa i actua.
Dels jocs tancats a la simulació oberta del món
Durant anys, DeepMind ha desenvolupat agents capaços de dominar entorns ben definits, com els escacs o el Go. Aquests sistemes excel·lien en universos amb regles clares, estats limitats i objectius perfectament delimitats. El repte de la intel·ligència artificial general (AGI), però, exigeix quelcom molt diferent: sistemes capaços de moure’s en la diversitat i la imprevisibilitat del món real.
Aquí és on entren els world models. Un model de món no només representa un escenari visual, sinó que simula les seves dinàmiques internes: com es mouen els objectes, com respon l’entorn a una acció, com s’encadenen causes i efectes. En lloc de carregar un mapa complet i tancat, el sistema genera “el camí del davant” a mesura que l’usuari avança.
Aquesta és precisament la base de Genie 3, el model de món presentat per DeepMind a l’agost i que ara alimenta Project Genie. A diferència dels entorns tridimensionals tradicionals, Genie 3 no es limita a reproduir escenes predefinides: construeix el món de manera dinàmica, coherent i contínua.
Un prototip per experimentar amb mons vius
Project Genie neix com una aplicació web experimental allotjada a Google Labs. El seu objectiu no és oferir un producte acabat, sinó permetre que investigadors, creadors i usuaris avançats experimentin de primera mà amb les capacitats —i les limitacions— dels models de món.
El sistema combina Genie 3 amb altres models de la casa, com Nano Banana Pro i Gemini, per articular una experiència immersiva basada en tres grans capacitats.
1. Dibuixar un món abans d’habitar-lo
La primera porta d’entrada és la creació de l’entorn. L’usuari pot descriure el món mitjançant text o imatges generades o carregades manualment. A partir d’aquesta informació, el sistema construeix un entorn viu que s’expandirà a mesura que s’explori.
Una de les claus és l’anomenat world sketching: la possibilitat de previsualitzar el món abans d’entrar-hi i ajustar detalls visuals, estil o atmosfera. L’usuari també defineix la perspectiva —primera o tercera persona— i el mode de desplaçament, des de caminar o conduir fins a volar, anticipant ja el tipus d’experiència que vol viure.
2. Explorar un entorn que es genera en avançar
Un cop a dins, el món no està “acabat”. Cada pas genera el següent fragment de l’entorn, calculat en temps real a partir de les accions de l’usuari. La càmera es pot ajustar lliurement i l’entorn respon de manera dinàmica, simulant físiques i interaccions bàsiques.
Aquest enfocament trenca amb la lògica clàssica del disseny de mons virtuals, on tot està preconstruït. Aquí, l’experiència s’acosta més a la improvisació guiada: el sistema manté coherència i continuïtat, però deixa espai a la sorpresa i a l’emergència de situacions no previstes explícitament.
3. Remezclar i reapropiar-se de mons existents
La tercera capacitat és el remix. Project Genie permet partir de mons ja creats —propis o aliens— i reinterpretar-los a partir de nous prompts. Hi ha una galeria de mons curats i un sistema de generació aleatòria per inspirar noves creacions.
A més, l’usuari pot descarregar vídeos de les seves exploracions, cosa que obre la porta a usos en creació audiovisual, prototipat narratiu o simple documentació d’experiències.
Molt potencial, però també límits clars
DeepMind insisteix que Project Genie és un prototip de recerca, no un producte final. Les limitacions són explícites i formen part del procés d’aprenentatge col·lectiu que la companyia vol fomentar.
Els mons generats no sempre són fidels a la realitat ni respecten estrictament les lleis físiques. El control dels personatges pot presentar latències o comportaments erràtics. Les generacions estan limitades a 60 segons i algunes capacitats anunciades prèviament per a Genie 3 —com esdeveniments que alteren el món durant l’exploració— encara no estan disponibles.
Aquesta transparència és rellevant. Davant la tendència a presentar demos espectaculars sense context, DeepMind subratlla que es tracta d’una tecnologia en fase primerenca, amb marge de millora i amb riscos que cal gestionar.
Més enllà de l’entreteniment: ciència, robòtica i narrativa
Tot i que la primera reacció pugui associar Project Genie al videojoc o a l’entreteniment interactiu, l’abast potencial és molt més gran. Els models de món són una peça clau per entrenar agents robòtics en entorns simulats, per provar hipòtesis científiques, per explorar reconstruccions històriques o per experimentar amb noves formes de narrativa interactiva.
Un món generat dinàmicament pot servir com a laboratori virtual on assajar decisions, observar conseqüències i refinar comportaments sense els costos ni els riscos del món físic. En aquest sentit, Project Genie funciona com un banc de proves públic per entendre com les persones interactuen amb mons generats per IA.
Un pas calculat cap a l’obertura
L’accés restringit a subscriptors avançats i majors d’edat no és casual. DeepMind vol observar usos, abusos i patrons d’interacció abans d’ampliar la disponibilitat. La companyia deixa clar que el seu objectiu final és fer aquesta tecnologia accessible a més usuaris, però només després d’entendre millor les seves implicacions tècniques i socials.
En última instància, Project Genie no és només una eina creativa. És una finestra a una nova generació de sistemes d’IA que no es limiten a respondre preguntes o generar imatges, sinó que construeixen realitats navegables. Mons que no existeixen fins que algú decideix explorar-los.

