Skip to main content

Un experiment amb models de llenguatge els va treure de l’aula i els va posar en una partida d’estratègia. Allà, sense manual ni pregunta correcta, el que va emergir no va ser només càlcul: van ser estils. I decisions que delaten una forma de pensar.

Quan el joc canvia les regles

El dilema del presoner iterat consisteix en una escena repetida on dos jugadors trien entre col·laborar o trair, sense saber què farà l’altre. I tornen a triar, una i altra vegada. El que està en joc no és un punt per resposta correcta, sinó una lògica de fons per saber llegir el rival, construir confiança, o trencar-la a temps.

Al juliol de 2025, un equip d’ETH Zuric va utilitzar aquest clàssic per mesurar la intel·ligència dels grans models de llenguatge. Van participar GPT-4o, Claude, Gemini i altres. Cada un va jugar centenars de rondes contra rivals amb estratègies ben conegudes: alguns castigaven una traïció per sempre, altres perdonaven ràpidament. Però aquesta vegada, els humans no estaven al tauler.

Estils que no són atzar

Els resultats es van repetir amb una regularitat inesperada. Gemini va ser el més dur. Traïa primer, aprofitava cada gest ingenu, i canviava de pressa si ensumava risc. GPT-4o va actuar com l’optimista, mantenint la cooperació fins i tot quan era evident que l’altre no ho faria. Claude va mostrar una via intermèdia, gairebé humana. Donava una altra oportunitat, però sabia retirar-se a temps. Cap va memoritzar un patró. Cada model va reaccionar al que tenia davant. I això suggereix alguna cosa més que predicció de text: una forma de raonament adaptatiu.

Pensar per torns

En total, els investigadors van recollir més de 30.000 explicacions escrites pels models, justificant cada jugada. Algunes parlaven de justícia, altres de càlcul, moltes mencionaven la història compartida. Però no era improvisació, els textos mostraven una lògica darrere del moviment. El joc obligava a construir una idea de l’altre, a imaginar què passaria si…

Un mirall nou per a la IA

La majoria de les avaluacions d’intel·ligència artificial mesuren redacció, resum o traducció. Aquest estudi planteja una altra cosa: com actua un model quan ha d’adaptar-se, quan la millor jugada no està en el manual? El dilema del presoner no mesura coneixement, sinó estratègia. I el resultat dibuixa una diferència que no està en les dades, sinó en la forma d’utilitzar-les. Perquè fins i tot entre algoritmes, no tots juguen igual.

Obre un parèntesi en les teves rutines. Subscriu-te a la nostra newsletter i posa’t al dia en tecnologia, IA i mitjans de comunicació. 

Leave a Reply