OpenAI respon a la pressió de Gemini 3 amb el llançament de GPT‑5.2

El nou model d’intel·ligència artificial d’OpenAI, GPT‑5.2, no només respon més de pressa ni escriu amb menys errors, vol acompanyar els usuaris en tasques llargues, complexes i canviants, des de planificar projectes fins a analitzar dades visuals. Aquest llançament marca un nou capítol en la cursa per desenvolupar una IA que no només conversi, sinó que actuï, decideixi i col·labori. La diferència ja no està en quantes paraules pot generar per minut, sinó en com es mou en entorns híbrids de text, codi i eines.

GPT-5.2 is here! Available today in ChatGPT and the API.

It is the smartest generally-available model in the world, and in particular is good at doing real-world knowledge work tasks.

— Sam Altman (@sama) December 11, 2025

Què fa diferent a GPT‑5.2

GPT‑5.2 és l’evolució directa del model que potencia ChatGPT i l’API d’OpenAI. Encara que manté l’arquitectura base de la sèrie GPT‑4, inclou avenços substancials en raonament, ús d’eines, memòria contextual, visió multimodal i eficiència computacional. OpenAI afirma que és el seu model més capaç fins ara, i les primeres anàlisis ho confirmen.

Això es tradueix en millores concretes:

Manté coherència en entrades de text molt extenses (fins a 1 milió de tokens en el mode Pro).
Integra una memòria més persistent i adaptable, que recorda preferències de l’usuari.
Interpreta imatges, gràfics i esquemes complexos, a més de text.
Activa eines externes (com navegadors, fulls de càlcul o editors de codi) de forma automatitzada.
Millora la latència i el consum energètic, cosa que redueix costos operatius.

En proves internes, GPT‑5.2 va mostrar avenços en benchmarks clau com MMLU, GPQA i DROP, amb puntuacions superiors a GPT‑4 Turbo i comparables —o lleugerament superiors— a les de Gemini 1.5 Pro, el model de Google. Segons Linux Adictos, arriba a un 70,9 % en el benchmark GDPval i un 93 % d’encerts en GPQA Diamond, especialitzat en preguntes de ciència.

Una IA, tres modes d’ús i una memòria més útil

El model es desplega en ChatGPT sota tres modes diferents com solen fer últimament: Instant, Thinking i Pro.

Instant està dissenyat per oferir respostes gairebé immediates. Perfecte per a tasques simples o conversa informal.
Thinking introdueix pauses calculades per processar millor informació complexa. Recomanat per a programació, anàlisi de text o generació de continguts més llargs.
Pro combina màxima capacitat de context, accés a eines externes i raonament avançat. Està orientat a tasques empresarials, ciència de dades o investigació.

A més, OpenAI ha potenciat la memòria de llarg termini en ChatGPT, ara capaç de recordar detalls clau sobre preferències, projectes anteriors o estil de l’usuari. Aquesta memòria es pot consultar, editar o desactivar, cosa que ofereix més control i transparència.

Agents, visió, eines: l’ecosistema creix

GPT‑5.2 es recolza en una arquitectura d’agents especialitzats, petites unitats funcionals que s’activen per a tasques específiques. Des d’extreure dades d’un PDF, a actualitzar un document, cercar informació o generar gràfics. Aquests agents no són aplicacions externes, sinó funcions internes del model que actuen segons el context.

La integració multimodal permet que el model llegeixi imatges, PDF, taules o fragments de codi com a part natural del flux de treball. Això amplia la seva utilitat en àrees com finances, enginyeria, educació i planificació. Pot, per exemple, interpretar un gràfic borsari, generar conclusions en llenguatge natural i proposar accions automatitzades en un sistema extern.

GPT‑5.2 també pot elaborar fulls de càlcul, presentacions i informes amb menor necessitat d’intervenció humana, i automatitzar fluxos de treball habituals en entorns empresarials.

En combinació amb l’API “Assistants” GPT‑5.2 es converteix en la peça central de sistemes automatitzats que barregen llenguatge, lògica i acció, cosa que fins ara només era possible amb múltiples eines encadenades per humans.

El context competitiu i les decisions internes

Segons filtracions publicades per Reuters i confirmades per TechCrunch, el desenvolupament i desplegament de GPT‑5.2 va ser accelerat per una alerta interna a OpenAI. La publicació de Gemini 3, amb la seva capacitat per manejar fins a 1 milió de tokens, va generar un “codi vermell” que va portar a prioritzar aquesta actualització davant d’altres desenvolupaments.

Sam Altman i l’equip directiu haurien optat per reforçar la línia GPT‑4 amb funcions incrementals abans que esperar al salt arquitectònic que suposarà GPT‑6. Així, GPT‑5.2 no és un model totalment nou, però sí un pivot estratègic per mantenir lideratge en usabilitat, integració i fiabilitat.

Les comparacions amb Gemini 1.5 Pro, Claude 3 i els futurs models de Meta mostren diferències mínimes en tasques acadèmiques o conversacionals, però GPT‑5.2 destaca en el seu ecosistema d’eines, control de context i flexibilitat per a l’usuari final.

Dilemes operatius: automatització sense explicació

GPT‑5.2 no es presenta com una IA general, però sí com una intel·ligència autònoma en tasques professionals. Pot prendre decisions operatives simples sense supervisió directa. Aquest avenç, encara que desitjat per moltes empreses, planteja preguntes sobre supervisió, responsabilitat i traçabilitat.

El model permet activar o desactivar la memòria, revisar converses anteriors i limitar l’accés a eines, però no tots els usuaris sabran com fer-ho. La confiança, en aquest cas, depèn tant del disseny com del nivell d’alfabetització digital.

Un nou estàndard en la cursa per la IA útil

GPT‑5.2 no busca impressionar amb respostes creatives, sinó resoldre problemes reals amb autonomia i precisió. És un model pensat per treballar, no per entretenir. La seva utilitat es mesura per la quantitat de processos que pot automatitzar, la qualitat de les decisions que proposa i la facilitat amb què s’integra en entorns complexos.

Per a usuaris avançats, desenvolupadors o equips empresarials, és una eina versàtil que combina llenguatge natural, lògica de programació i accés a recursos externs. Per a usuaris comuns, serà l’assistent que ja no necessita preguntar-ho tot per saber què fer. El futur no és només conversacional. És operatiu, silenciós i cada vegada més integrat.

Obre un parèntesi en les teves rutines. Subscriu-te al nostre butlletí i posa’t al dia en tecnologia, IA i mitjans de comunicació.

Tags:

OpenAI respon a la pressió de Gemini 3 amb el llançament de GPT‑5.2

Què fa diferent a GPT‑5.2

Una IA, tres modes d’ús i una memòria més útil

Agents, visió, eines: l’ecosistema creix

El context competitiu i les decisions internes

Dilemes operatius: automatització sense explicació

Un nou estàndard en la cursa per la IA útil

Tags:

Aina Vall

Previous PostDisney inverteix en OpenAI i autoritza l'ús dels seus personatges en vídeos generats amb IA

Next PostMicrosoft desenvolupa una IA per estudiar milers de tumors sense proves addicionals

Leave a Reply

Qui som

Política de Privadesa

(TikTok)

(YouTube)

(Linkedin)

(Instagram)

(X)