Skip to main content

Project Genie ja no només imagina mons a partir de text o imatge: ara pot ancorar-los en llocs reals de Google Maps Street View, una frontera que apropa la IA generativa als videojocs, la simulació urbana, la robòtica i els futurs entorns interactius.

Google acaba de fer un pas decisiu en una de les línies més ambicioses de la intel·ligència artificial generativa: la creació de mons interactius. Project Genie, el prototip experimental de Google DeepMind i Google Labs capaç de generar entorns explorables a partir d’instruccions, es connecta ara amb Google Maps Street View. La novetat permet crear mons simulats a partir de llocs reals dels Estats Units, escollir un estil visual —com “Desert Sands”, “Ocean World”, “Stone Age” o “B&W film”—, descriure un personatge i explorar una versió imaginada, navegable i generada amb IA d’aquell punt del món físic.

La notícia va ser anunciada per Google Labs a X i ampliada per Google al seu blog oficial. La companyia explica que està connectant Project Genie amb gairebé 20 anys d’imatges de Google Street View perquè els usuaris puguin crear mons “ancorats a la realitat”. És a dir, Genie deixa de treballar únicament des de prompts abstractes i comença a recolzar-se en una de les bases de dades visuals més extenses del planeta: els carrers, façanes, carreteres, places, paisatges i espais urbans fotografiats per Google Maps durant dues dècades.

El canvi és molt més important del que sembla. Fins ara, la IA generativa havia demostrat una capacitat creixent per crear text, imatges, música, vídeo i codi. Però els mons interactius representen una altra categoria: no n’hi ha prou amb generar una imatge bonica ni un clip convincent; el sistema ha de sostenir un espai navegable, respondre a la interacció de l’usuari, mantenir coherència visual i produir una sensació mínima de continuïtat espacial. Google defineix Project Genie com un prototip de recerca que permet crear i explorar mons infinitament diversos.

La connexió amb Street View introdueix una dimensió nova: la realitat com a punt de partida. Un usuari pot escollir un lloc al mapa dels Estats Units, demanar un estil fantàstic i crear un entorn que parteix de referències reals. Google ofereix exemples molt gràfics: convertir el Golden Gate Bridge en un món submarí amb peixos mitjançant l’estil “Ocean World”, o recrear els Fort Worth Stockyards de Texas com si fossin una pel·lícula en blanc i negre dels anys vint, amb saloons, cotxes antics i parades comercials.

La funció, anomenada Street View Grounding, està disponible inicialment per a llocs dels Estats Units, amb plans d’expansió a més regions. A més, Project Genie comença a desplegar-se gradualment per als subscriptors elegibles de Google AI Ultra arreu del món, majors de 18 anys. Google AI Ultra és el pla premium de la companyia, amb un preu de 200 dòlars mensuals als Estats Units, que dona accés a les eines més avançades d’IA de l’ecosistema Google.

El moviment encaixa perfectament amb l’estratègia presentada per Google a I/O 2026: convertir Gemini i els seus models associats en una capa d’intel·ligència capaç d’operar sobre text, imatge, vídeo, veu, mapes, documents, navegació i entorns interactius. Project Genie no és un chatbot ni un generador de vídeo convencional. És un model de món. I aquest concepte —world model— pot convertir-se en una de les paraules clau de la pròxima etapa de la IA.

Un model de món no es limita a produir contingut; intenta simular un entorn. Per als humans, comprendre el món implica anticipar què passa si ens movem, empenyem alguna cosa, mirem darrere d’una cantonada o tornem a un lloc ja visitat. La IA generativa tradicional no necessita aquesta consistència per escriure un text o generar una imatge. Però un món interactiu sí. Ha de recordar espais, conservar relacions, permetre exploració i respondre al moviment. Google DeepMind ja descriu Genie 3 com un sistema amb més consistència i estabilitat, capaç de recordar detalls vistos prèviament quan s’hi torna i de sostenir interacció sense degradar-se immediatament.

Aquí hi ha la clau: Project Genie no interessa només a jugadors o creadors de mons fantàstics. Google suggereix explícitament que aquesta expansió pot proporcionar entorns virtuals perquè agents d’IA o robots naveguin i interactuïn amb la complexitat del món real. Font: https://blog.google/innovation-and-ai/models-and-research/google-deepmind/project-genie-expands/ Aquesta frase obre una porta enorme. La simulació generativa pot servir per entrenar sistemes autònoms, provar comportaments, generar escenaris estranys, ensenyar agents a moure’s o imaginar variants d’espais reals sense haver-los de recrear manualment.

En robòtica, un dels grans problemes és l’accés a dades diverses i situacions variades. Un robot ha d’aprendre a operar en cases, carrers, magatzems, hospitals, botigues o fàbriques. Construir simulacions manuals de tots aquests entorns és car. Si una IA pot generar mons interactius ancorats a Street View, s’obre la possibilitat de crear escenaris gairebé infinits per a entrenament, avaluació o exploració. Encara som lluny d’una simulació física perfecta, però el camí és clar: de la imatge generativa a l’entorn generatiu.

En videojocs, l’impacte també és evident, tot i que convé moderar l’entusiasme. Quan Google va mostrar Project Genie a començaments de 2026, les accions d’algunes empreses vinculades a motors de joc i plataformes van patir pressió perquè el mercat va interpretar que la generació de mons podia amenaçar eines com Unity, Roblox o fins i tot estudis tradicionals. Take-Two, editora de GTA 6, va respondre que Genie “ni tan sols juga a la mateixa lliga” que un motor de joc real, perquè no substitueix història, disseny de missions, mecàniques, jugabilitat profunda ni direcció creativa.

Aquesta advertència continua sent vàlida. Project Genie no és un Unreal Engine màgic ni un substitut immediat d’un estudi de videojocs. Els mons generats poden ser explorables, però això no equival a un joc complet. Un videojoc necessita regles, objectius, progressió, narrativa, equilibri, interacció precisa, sistemes de físiques, economia interna, personatges, missions, disseny de nivells i una direcció artística consistent. Genie pot accelerar el prototipatge, inspirar mons o generar entorns navegables, però encara no substitueix l’enginyeria i el disseny de joc.

La diferència entre “món” i “joc” és essencial. Un món pot ser un espai. Un joc és un sistema de decisions. Genie està molt més a prop d’una eina d’exploració visual i espacial que no pas d’un producte jugable complet. Però això no redueix la seva importància. Al contrari: moltes revolucions creatives comencen com eines imperfectes que amplien la imaginació. La càmera no va substituir el cinema; va fer possibles noves formes de cinema. Els motors 3D no van substituir el disseny de videojocs; van canviar com es dissenyaven. Genie pot convertir-se en una eina d’ideació espacial.

Per a arquitectes, urbanistes, dissenyadors d’experiències, creadors de mons, educadors i artistes digitals, la combinació de Street View i generació interactiva és especialment suggeridora. Permet partir d’un lloc real i reinterpretar-lo: un carrer convertit en desert, un barri inundat, una plaça transformada en escenari medieval, una autopista convertida en selva o un monument reconstruït en una altra època. Això pot servir per a educació històrica, visualització climàtica, turisme imaginatiu, prototips d’instal·lacions, narratives immersives o projectes artístics.

Però també apareixen preguntes delicades. Street View és un arxiu visual massiu del món físic. En connectar-lo amb IA generativa, Google converteix imatges de carrers reals en material de simulació creativa. Què passa amb la representació de barris, habitatges, comerços o espais sensibles? Quins límits hi haurà per generar mons sobre llocs reals? Com s’evitaran usos ofensius, enganyosos o invasius? Podrà algú crear una versió distorsionada d’un carrer concret, compartir-la i presentar-la com una experiència real? Google haurà d’afrontar aquestes preguntes a mesura que expandeixi la funció fora dels Estats Units.

La companyia subratlla que Project Genie continua sent un prototip experimental de recerca i que treballa per millorar detalls i precisió. També reconeix limitacions actuals. Aquesta prudència és important. Els mons generats amb IA poden semblar convincents, però no s’han de confondre amb reconstruccions fidels. Un entorn ancorat a Street View no és una rèplica exacta del lloc. És una interpretació generativa, una simulació estilitzada que parteix d’imatges reals.

La nova biblioteca de creacions afegeix una altra capa pràctica. Google Labs va anunciar que els usuaris podran emmagatzemar i organitzar els seus mons generats, explorar creacions anteriors i remesclar preferides per iterar idees. La funció sembla menor, però és clau per convertir Genie en eina de treball. Sense biblioteca, cada món és una curiositat efímera. Amb biblioteca, apareix un flux creatiu: crear, guardar, comparar, remesclar, compartir, millorar.

La possibilitat de compartir externament mons generats reforça aquesta lògica. Qualsevol persona podrà veure una vista prèvia en vídeo d’un món compartit, i els subscriptors Ultra podran explorar-lo o remesclar-lo. Això apropa Genie a una cultura de plataforma: no només crear per a un mateix, sinó publicar mons, fer-los circular i permetre que altres els transformin. Si funciona, Google podria estar sembrant una xarxa social de microentorns generatius.

Aquesta dimensió social pot ser decisiva. La història d’internet demostra que les eines creatives es tornen poderoses quan es comparteixen: YouTube per al vídeo, Instagram per a la imatge, TikTok per als clips, Roblox per als mons i jocs, Minecraft per a la construcció, Figma per al disseny col·laboratiu. Project Genie podria aspirar a alguna cosa semblant en miniatura: una capa de mons generats, explorables i remesclables. Però per arribar-hi necessita resoldre estabilitat, durada, control, qualitat i moderació.

L’accés limitat a Google AI Ultra també defineix el moment actual. Genie no és encara un producte de consum massiu. Està reservat a usuaris premium, adults i elegibles, amb desplegament gradual. Aquesta limitació té diverses lectures. D’una banda, reflecteix el cost computacional de generar mons interactius. De l’altra, permet a Google controlar riscos i recopilar feedback abans d’obrir el sistema. I, a més, converteix Genie en un dels reclams del pla Ultra, amb el qual Google competeix contra OpenAI, Anthropic i altres ofertes premium d’IA.

La competència no serà menor. OpenAI ha demostrat capacitat en vídeo generatiu amb Sora. Runway, Luma i Pika treballen en generació audiovisual. Meta i Roblox exploren mons generats, eines per a creadors i entorns interactius. Nvidia impulsa simulació física i mons digitals per a robòtica i indústria. Google, amb Genie i Street View, aporta un ingredient propi: dades geogràfiques i visuals del món real a escala planetària.

Aquest és el seu gran diferencial. Altres poden generar mons imaginaris. Google pot ancorar-los en mapes, carrers, imatges i context geogràfic. La integració amb Street View no és només una funció atractiva; és un avantatge estratègic basat en dues dècades d’acumulació de dades. Poques companyies posseeixen un arxiu comparable del món físic. I això pot convertir Google en actor central de la simulació generativa.

El risc és que aquest avantatge reforci encara més la concentració de poder. Si Google controla mapes, imatges de carrers, models generatius, navegador, mòbils, cercador i subscripció premium, pot convertir-se en intermediari dominant d’una nova capa espacial d’internet. Avui busquem llocs a Maps; demà podríem explorar-los com mons generats, reinterpretats i personalitzats. La frontera entre mapa, videojoc, simulació i contingut creatiu començaria a difuminar-se.

El potencial educatiu és enorme. Un professor podria portar alumnes a una versió prehistòrica d’un paisatge, a una ciutat inundada pel canvi climàtic, a un barri transformat per una altra època o a un monument vist sota estils històrics. Però l’educació exigeix rigor. Si els mons generats barregen realitat i fantasia, s’han d’etiquetar clarament. En cas contrari, poden produir confusió. La imaginació és poderosa quan es presenta com a imaginació, no com a reconstrucció històrica exacta.

També hi ha una lectura per a turisme i patrimoni. Museus, ciutats i destinacions podrien utilitzar tecnologies similars per oferir recorreguts alternatius: com era un carrer en un altre segle, com podria ser amb vegetació, com es veuria sota l’aigua o com canviaria amb noves infraestructures. Però aquí tornaran les preguntes sobre precisió, drets, representació i control de la narrativa urbana.

En urbanisme, els models de món podrien servir per imaginar intervencions abans de construir-les. Una plaça amb arbres, carrils bici, menys cotxes o nous edificis podria visualitzar-se de manera interactiva. Però Project Genie, tal com existeix avui, no és una eina professional de planificació. No ofereix precisió mètrica, simulació física fiable ni garanties tècniques. Seria, per ara, una eina d’imaginació i comunicació, no de càlcul urbanístic.

En robòtica i agents, en canvi, la direcció a llarg termini és més profunda. Google DeepMind ha treballat durant anys en models que aprenen d’entorns simulats. Si Genie pot generar mons variats a partir de dades reals, podria alimentar sistemes que necessiten practicar en escenaris abans d’enfrontar-se al món físic. Això connecta amb una gran aspiració de la IA: construir agents que entenguin l’entorn, no només el llenguatge.

La IA de text pot raonar sobre el món, però no necessàriament l’experimenta. Els models de món intenten tancar aquesta bretxa. Permeten a un sistema aprendre relacions espacials, conseqüències de moviment, persistència d’objectes i dinàmica ambiental. Si un agent ha de moure’s en una casa, un carrer o un magatzem, necessita alguna cosa més que paraules. Necessita simulació. Genie apunta en aquesta direcció.

Tot i així, la distància entre una simulació visual i una simulació física fiable és gran. Que un món sembli real no significa que funcioni com el món real. Per a robots, importen la geometria, la física, la fricció, la il·luminació, els obstacles, l’escala, la precisió d’objectes i les conseqüències de les accions. Una al·lucinació visual pot ser divertida en un entorn creatiu, però perillosa en entrenament robòtic si es pren com a realitat.

Per això Google utilitza el terme “experimental”. Project Genie és un senyal de futur, no una solució acabada. El seu valor actual és mostrar cap on es dirigeix la IA generativa: de produir peces aïllades a produir entorns. L’evolució és clara: primer text, després imatge, després vídeo, ara mons interactius. Cada etapa afegeix una dimensió de complexitat. El món generat no és només contingut; és espai navegable.

L’arribada de Street View Grounding també converteix Google Maps en alguna cosa més que cartografia. Maps ja no és només una eina per arribar d’un punt a un altre. Pot convertir-se en matèria primera d’experiències generatives. Això obre possibilitats comercials: turisme immersiu, publicitat geolocalitzada, jocs basats en llocs reals, educació urbana, simulacions d’esdeveniments o experiències de marca. Però també exigeix governança. Els llocs reals tenen comunitats reals.

La moderació serà difícil. Quins tipus de mons es permetran sobre llocs sensibles? Es podran generar escenes violentes sobre edificis públics, escoles o barris residencials? Es podran distorsionar monuments religiosos o llocs de memòria? Com es gestionaran reclamacions de persones o negocis? Street View ja va afrontar debats de privacitat des dels seus inicis; Genie afegeix una capa imaginativa que pot amplificar tensions.

La funció de compartir externament farà més urgent aquest debat. Mentre els mons queden dins d’un compte individual, el risc és limitat. Quan es publiquen i altres els remesclen, apareix circulació social. Un món generat pot fer-se viral, ser malinterpretat, utilitzar-se com a propaganda visual o convertir-se en burla d’un lloc real. Google haurà d’equilibrar creativitat i responsabilitat.

També caldrà considerar drets sobre les creacions. Si un usuari genera un món basat en Street View i estil propi, què en pot fer? El pot monetitzar? El pot utilitzar en un videojoc, vídeo, anunci o projecte artístic? Quins drets conserva Google per aportar la base de Street View i el model? Aquestes preguntes seran cada vegada més rellevants si els mons generats passen d’entreteniment a producció professional.

Des del punt de vista de producte, Project Genie encara sembla més una demostració de frontera que una eina madura. Però aquest també va ser el cas de molts avenços generatius. Les primeres imatges amb IA tenien artefactes evidents. Els primers vídeos eren inestables. Els primers chatbots al·lucinaven més. La corba de millora ha estat ràpida. Si els models de món segueixen una trajectòria similar, en pocs anys podríem veure entorns molt més llargs, consistents, editables i exportables.

La paraula clau serà control. Els creadors no voldran només generar un món; voldran dirigir-lo. Demanaran canviar un carrer, mantenir un personatge, modificar llum, inserir objectes, fixar regles, crear missions, exportar escenes, integrar àudio, utilitzar càmeres virtuals i connectar mons entre si. Sense control fi, Genie serà una curiositat. Amb control, pot convertir-se en una eina creativa poderosa.

La integració amb una biblioteca i remescla apunta justament a aquest camí. Google entén que la generació única no n’hi ha prou. Els professionals necessiten iteració. Un món no es crea d’una vegada; es desenvolupa. Es prova, es modifica, es guarda, es compara, es comparteix i es remescla. La creativitat generativa madura quan deixa de ser sorpresa i es converteix en procés.

La notícia també encaixa en la guerra de subscripcions d’IA. Google AI Ultra, OpenAI ChatGPT Pro, Claude Max o plans equivalents competeixen per usuaris avançats disposats a pagar més per accés anticipat, límits més alts i funcions experimentals. Project Genie és un argument poderós per a Ultra perquè no tots els competidors poden oferir mons ancorats a Street View. És una funció exclusiva, visual i diferenciadora.

Però el cost de 200 dòlars mensuals limita l’adopció. Per ara, Genie serà provat per creadors, desenvolupadors, entusiastes, investigadors i professionals curiosos. Si Google vol convertir-lo en plataforma massiva, haurà de baixar barreres, ampliar països i permetre usos més econòmics. La història de les eines generatives mostra que la massa crítica arriba quan l’accés es simplifica.

La relació amb Google Maps pot obrir també futures integracions en Android XR, ulleres intel·ligents o entorns de realitat augmentada. Imaginem explorar una ciutat real i superposar-hi mons generatius: una capa històrica, submarina, futurista o educativa. Project Genie encara no és això, però Street View Grounding és un pas conceptual en aquesta direcció. La frontera entre simulació i realitat augmentada s’estreny.

L’anunci de Google Labs té, per tant, diverses capes. Per a l’usuari, és una forma divertida de crear mons a partir de llocs reals. Per a creadors, una eina d’ideació espacial. Per a Google, un reclam premium i una demostració de poder de dades. Per a DeepMind, un avenç en models de món. Per a robòtica, una possible infraestructura de simulació. Per a videojocs, un senyal de cap on pot anar el prototipatge. Per a la societat, una nova pregunta sobre com es representa generativament el món físic.

La conclusió és clara: Project Genie no és encara el futur complet dels videojocs, ni del metavers, ni de la robòtica. Però sí que és una peça important d’aquesta transició. Google ha connectat una IA de mons amb l’arxiu visual dels seus mapes. Això significa que la generació d’entorns deixa de flotar en la imaginació pura i comença a recolzar-se en carrers, ponts, barris i paisatges reals.

Si la IA generativa va començar escrivint textos, després va aprendre a dibuixar imatges i més tard a produir vídeos, Project Genie apunta al següent territori: mons on es pot entrar. I quan aquests mons comencen a Street View, la pregunta ja no és només què pot imaginar la IA. La pregunta és què farà amb la realitat quan comenci a convertir-la en espai jugable, remesclable i compartit.

Leave a Reply