Google ha presentat Gemini 3 —una evolució dels seus models d’IA més avançats— amb promeses de comprensió multimodal, raonament profund i capacitats d’agent autònom. Segons la companyia, aquest model marca un salt qualitatiu. Vegem com funciona, què ofereix, quines dades empra, quines tensions genera i com es situa davant d’altres desenvolupaments.
Una arquitectura que aprèn de tot
Gemini 3 hereta l’arquitectura de generacions anteriors del projecte Gemini, impulsat per la divisió Google DeepMind, i amplia les seves capacitats clau de raonament, multimodalitat (text, imatge, vídeo, àudio, codi) i agents autònoms. El model incorpora una finestra de context d’un milió de tokens. Això li permet analitzar informació extensa i de múltiples formats sense perdre coherència. A més, s’introdueix un mode de resolució avançada anomenat «Deep Think» per a tasques complexes. Per a desenvolupadors, Google llança Antigravity, una plataforma orientada a la creació d’agents intel·ligents amb Gemini 3 com a nucli.
El que promet: de la idea al flux de treball
Google presenta Gemini 3 com el seu model més intel·ligent fins ara. El seu objectiu és que l’usuari pugui aprendre, construir i planificar qualsevol cosa. Entre les seves funcionalitats destaca el «vibe coding», és a dir, programar sense saber programar. Una forma de programació assistida que converteix idees espontànies en aplicacions funcionals, passant de prompt a codi executable. Gemini 3 s’integra directament en productes clau de Google com el Cercador, l’app Gemini i les eines per a desenvolupadors. La promesa és una IA que acompanya l’usuari no només com a assistent, sinó com a col·laborador actiu.
Les dades que alimenten el model
Gemini 3 s’entrena amb dades multimodals: text, imatges, vídeos, àudio i codi. Aquesta combinació li permet respondre a consultes que barregen formats, com analitzar un document i un vídeo en una mateixa sessió. L’ampliació del context permet treballar amb documents llargs, gravacions extenses o fluxos de dades combinats sense fragmentar la resposta. Segons Google, el model ha estat sotmès al conjunt més ampli d’avaluacions de seguretat que ha aplicat fins ara, amb l’objectiu de reforçar la seva resistència davant d’usos indeguts.
Tensions que creixen amb l’autonomia
El salt en capacitats porta també noves tensions. Una IA capaç de planificar tasques, gestionar correus o coordinar calendaris accedeix a informació sensible. Això planteja preguntes sobre privacitat, supervisió i control. La promesa del «vibe coding» pot reduir la barrera tècnica, però també desplaça tasques de validació. Si la IA escriu codi funcional, qui revisa la seva seguretat?
D’altra banda, en integrar-se en l’ecosistema de Google, Gemini 3 reforça la posició dominant de la companyia. No només com a proveïdor de cerques, sinó com a infraestructura d’IA per a milions d’usuaris i desenvolupadors.
Davant dels seus competidors
En avaluacions externes com LMArena, Gemini 3 Pro ha superat la seva versió anterior: 1.501 punts davant dels 1.451 de Gemini 2.5 Pro. A més, aconsegueix puntuacions rècord en tasques de raonament general, segons TechCrunch.
Amb Antigravity, Google entra de ple en la cursa pels agents autònoms, una tendència compartida amb empreses com OpenAI o Meta. La diferència és que Google ho fa des del seu cercador, el seu núvol i la seva app d’IA, cosa que li permet tancar el cercle entre infraestructura i producte.
Quan la IA ja no només respon
Gemini 3 no busca només contestar preguntes. Aspira a convertir-se en un actor que col·labora, planifica i executa. En aquesta nova etapa, la IA deixa de ser un destí per convertir-se en un mitjà, una eina que transforma idees en processos, decisions en fluxos i preguntes en accions.
Obre un parèntesi en les teves rutines. Subscriu-te al nostre butlletí i posa’t al dia en tecnologia, IA i mitjans de comunicació.