Skip to main content

El 21 de juliol de 2025 marca una fita en la història de la intel·ligència artificial: Google DeepMind va donar a conèixer que la seva avançada versió de Gemini Deep Think va assolir puntuació de medalla d’or en la passada Olimpíada Internacional de Matemàtiques (IMO). El sistema va resoldre cinc dels sis problemes, equivalents a una puntuació de 35 sobre 42, dins del límit de 4,5 hores, completament en llenguatge natural i sense assistència humana.

De la plata a la glòria

En l’edició anterior, DeepMind havia aconseguit medalla de plata amb una combinació de AlphaProof i AlphaGeometry 2, basant-se en traduccions a llenguatges formals com Lean i càlculs que van durar fins a diversos dies. Aquesta vegada, Gemini va demostrar la seva evolució: va raonar, va explicar i va provar directament en llenguatge natural, d’aquí al mateix temps que els estudiants, eliminant traduccions manuals i temps de càlcul prolongats.

Deep Think: pensament paral·lel

El motor Deep Think empra tècniques avançades de raonament paral·lel, explorant múltiples camins simultàniament abans de consolidar la resposta més robusta. Aquest enfocament, juntament amb un reforçament entrenat amb corpus de solucions matemàtiques i «hints» estructurats, va permetre que el sistema generés proves clares, precises i llegibles per als correctors de l’IMO.

Validació oficial i reconeixement

A diferència d’OpenAI, que també va reportar puntuació d’or resolent cinc problemes, la versió de Gemini va ser part d’una «cohort inaugural» els resultats de la qual van ser oficialment avaluats i certificats pels correctors de l’IMO. Aquesta certificació reforça la solidesa de l’assoliment. Segons Gregor Dolinar, president de l’IMO, les solucions «van ser clares, precises i fàcils de seguir».

IA generalista vs. especialitzada

Tant DeepMind com OpenAI van utilitzar models orientats al raonament general. OpenAI va potenciar el seu model amb «test‑time compute» intensiu i raonament paral·lel. No obstant això, mentre Gemini va emfatitzar el seu nou sistema de Deep Think amb interacció paral·lela i aprenentatge reforçat, el model d’OpenAI va emprar una estratègia més centrada a mantenir múltiples trajectòries de raonament durant l’examen.

Què ve ara?

Ambdues companyies consideren aquest avenç com preludi d’una col·laboració creativa entre IA i matemàtics, amb aplicacions potencials en àrees avançades com la física. Encara que cap de les dues alliberarà aquests models al públic a curt termini, OpenAI anticipa mesos i DeepMind llançarà un pilot per a «trusted testers», el registre oficial de Gemini i el seu rendiment dins del temps real obren una nova era en la col·laboració home-màquina.

Obre un parèntesi en les teves rutines. Subscriu-te al nostre butlletí i posa’t al dia en tecnologia, IA i mitjans de comunicació.

Leave a Reply