Skip to main content

Com si activés un nou mode de pensar en una màquina ja desperta, OpenAI ha presentat GPT-5.1, la versió més recent del seu model de llenguatge, i ho ha fet amb una novetat cridanera. L’actualització no només millora el rendiment general de l’assistent de ChatGPT, sinó que introdueix dos estils diferents d’interacció: «Instant» i «Thinking». Aquesta dualitat marca un canvi de ritme en com es presenta la intel·ligència artificial a l’usuari, depenent de si es busca rapidesa o profunditat.

Un interruptor entre rapidesa i reflexió

En la pràctica, el model Instant està dissenyat per a converses àgils, com quan es busca una definició ràpida o un suggeriment immediats per a un correu, respostes breus i un to més proper. S’assembla a aquell company que sempre té una resposta a punt.

D’altra banda, el mode Thinking s’activa quan la tasca requereix més raonament o context, en situacions com la resolució d’un problema de programació o l’anàlisi d’un text llarg, on convé que la resposta tingui més cos i context. Pot trigar una mica més, però respon amb més rigor i profunditat, com qui es pren el seu temps abans de parlar.

Segons OpenAI, aquesta adaptació dinàmica permet que el model utilitzi menys recursos en tasques simples i desplegui tot el seu potencial en situacions complexes. Una mena de canvi automàtic entre primera i cinquena marxa.

Un salt en avaluacions de complexitat

La versió 5.1 ha mostrat millores destacades en proves de matemàtiques, programació i comprensió d’instruccions. En les avaluacions internes de l’empresa, supera a GPT-4 Turbo tant en eficiència com en precisió. En tasques de lògica o càlcul, Thinking es comporta amb més persistència i menor tendència a desviar-se, un defecte comú en versions anteriors.

També s’ha afinat la capacitat de l’assistent per detectar ambigüitats, com quan una pregunta pot tenir diversos significats possibles. Per exemple, si se li demana ‘fes-me un resum’, ara el model pot preguntar si es refereix a un text que se li acaba de proporcionar o si ha de generar-ne un de nou sobre un tema general i fer qüestions aclaridores quan és necessari. El resultat és un model que no només respon, sinó que també sap preguntar.

Personalitat a mida, amb un sol clic

Una de les funcions més visibles és el nou control de to. Els usuaris poden ajustar l’estil de resposta des de la interfície, triant entre un registre més formal, més directe o fins i tot humorístic. Aquesta personalització busca adaptar-se millor al context de cada interacció, des d’una consulta tècnica fins a una sessió de pluja d’idees. Encara que aquesta opció existia en versions anteriors a través d’«instruccions personalitzades», el nou panell ho simplifica i ho fa visible des del primer ús.

Dades, privacitat i memòria sota la lupa

OpenAI ha mantingut l’arquitectura basada en GPT-4 Turbo, amb accés a navegació web, documents i codi. La memòria també continua activa, i això permet que l’assistent recordi preferències i dades compartides prèviament, encara que aquesta funció pot desactivar-se. La gestió de la privacitat continua sent un dels punts més observats per experts i usuaris: què s’emmagatzema, durant quant de temps i amb quins fins.

OpenAI assegura que les converses no s’utilitzen per entrenar models per defecte, una política que manté respecte a versions anteriors, encara que difereix de pràctiques adoptades per altres empreses del sector, llevat que l’usuari ho permeti explícitament. No obstant això, el model continua aprenent a través d’altres vies, com l’ajust fi basat en exemples seleccionats.

Comparacions inevitables: cap a on apunta la IA

L’enfocament de GPT-5.1 recorda a altres sistemes que adapten la seva resposta segons el context, com Claude 2 d’Anthropic, que prioritza la seguretat i la claredat en generar respostes, o Gemini de Google, que s’integra amb l’ecosistema de productes del cercador per oferir interaccions més connectades. No obstant això, la possibilitat d’alternar entre modes en temps real i el nou control de to reforcen la idea d’una IA que ja no és només potent, sinó també versàtil segons el context.

Obre un parèntesi en les teves rutines. Subscriu-te al nostre butlletí i posa’t al dia en tecnologia, IA i mitjans de comunicació.

Leave a Reply