Skip to main content

Google ha activat aquest agost una funció que canvia el tempo dels seus models d’intel·ligència artificial. Es diu Deep Think, està integrada en Gemini 2.5 Pro i permet quelcom poc habitual en el món dels grans models: pensar en paral·lel abans de respondre. Com si, abans de contestar, la IA fes un tomb per diferents idees, les comparés en silenci i només llavors oferís la seva versió més afinada.

Una manera de pensar a diverses bandes

Deep Think permet a Gemini generar diverses hipòtesis simultàniament, avaluar-les internament i sintetitzar una resposta final. No és una funció menor: és una forma de raonament paral·lel que amplia el temps d’inferència (l’interval que el model dedica a «pensar» abans de respondre). Això li dóna més marge per explorar opcions creatives o estratègies complexes, sense limitar-se al primer que se li acut.

Per a tasques que no es resolen al vol

Deep Think està dissenyada per a contextos exigents: problemes matemàtics, depuració de codi, disseny de producte o planificació tècnica. En activar-se, Gemini 2.5 Pro pot també utilitzar eines com l’execució de codi o la cerca en línia durant el seu raonament (el que reforça la profunditat i precisió de les respostes).

Dades, accés i lletra petita

Google no ha detallat l’arquitectura exacta ni el nombre de paràmetres, però se sap que Deep Think opera sobre la infraestructura de DeepMind, amb capacitat multimodal i context expandit. L’accés està limitat a usuaris del pla Ultra, amb una subscripció mensual d’uns 250 dòlars (275 euros a Europa). S’activa des de la interfície de Gemini seleccionant la versió 2.5 Pro i marcant l’opció corresponent.

Pensar més també desgasta

El raonament paral·lel no és gratuït. Deep Think exigeix més potència de càlcul, i això ha portat Google a limitar-ne l’ús. A més, els resultats varien segons l’equilibri entre precisió i velocitat: en proves internes de tipus olimpíada matemàtica, la versió completa va aconseguir medalla d’or, però la versió oberta al públic només va assolir nivell bronze després de prioritzar la rapidesa de resposta. També s’ha observat una major cautela del model, que tendeix a negar-se més a peticions ambigües o fora de norma.

Entre els que millor raonen

En benchmarks com LiveCodeBench V6, Deep Think va aconseguir un 87,6% d’encert (per sobre del 79% de Grok 4, de xAI, i del 72% d’OpenAI o3). En Humanity’s Last Exam —que avalua ciència, humanitats i matemàtiques— va assolir un 34,8%, davant del 25,4% de Grok 4 i del 20,3% d’o3. Són xifres que el situen entre els models més precisos del moment, fins i tot sense ajudes externes.

La pregunta que queda al final

Deep Think converteix a Gemini 2.5 Pro en un model que no respon al primer impuls, sinó després de revisar rutes possibles. Un tipus d’IA que es deté a pensar. Però aquesta capacitat es paga: en diners, en energia i en exclusivitat. Queda en mans de l’usuari decidir si val la pena una IA que, abans de contestar, es pren uns segons per mirar al voltant.

Obre un parèntesi en les teves rutines. Subscriu-te al nostre butlletí i posa’t al dia en tecnologia, IA i mitjans de comunicació.

Leave a Reply