Skip to main content

El model d’intel·ligència artificial més potent de Google, el Gemini 2.5 Pro, ha aconseguit completar amb èxit el clàssic videojoc de 1996 Pokémon Blau

Aquest gran assoliment ha estat anunciat pel CEO de Google, Sundar Pichai, a través del seu compte de X en què ha mencionat: «Quin final! Gemini 2.5 Pro acaba de completar Pokémon Blau!».

Joel Z, un programador de 30 anys no afiliat a Google, ha estat l’artífex d’aquesta gesta; ell mateix va desenvolupar i transmetre en directe el projecte «Gemini Plays Pokémon» a la plataforma Twitch. Gemini 2.5 Pro va completar el videojoc en un total de 813 hores (aproximadament 34 dies) i més de 106.500 accions, convertint-se en la primera IA a aconseguir-ho en un joc d’aquestes característiques.

Si bé no va ser un projecte oficial de la companyia, executius de Google, com Logan Kilpatrick, líder de producte de Google AI Studio, van donar suport a la iniciativa i van seguir el seu progrés. Per exemple, quan Gemini 2.5 Pro va aconseguir la seva cinquena medalla en el joc, Kilpatrick va compartir i elogiar l’avenç en el seu compte de X: «Gemini 2.5 Pro continua fent grans progressos en completar Pokémon! Acaba d’obtenir la seva cinquena insígnia (el següent millor model només en té 3 fins ara, encara que amb un arnès d’agent diferent)».

L’ús de videojocs com Pokémon per provar o demostrar les capacitats dels models d’IA no és una novetat. Al febrer, l’empresa Anthropic va presentar els avenços del seu model Claude 3.7 Sonnet en Pokémon Vermell, destacant la seva capacitat de «pensament estès i entrenament com a agent» per resoldre tasques inesperades. No obstant això, Claude encara no ha aconseguit completar el joc.

Gemini ha completat el joc, però amb ajuda

Tant Gemini com Claude requereixen assistència per jugar. Utilitzen eines conegudes com a «agent harnesses», que els proporcionen captures de pantalla del joc amb informació addicional superposada, cosa que els permet prendre decisions i executar accions. Joel Z va explicar que va intervenir ocasionalment per millorar la capacitat de raonament de Gemini, però sense donar instruccions específiques ni solucions directes als desafiaments.

Aquest assoliment de Gemini 2.5 Pro no només marca un avenç en l’àmbit dels videojocs, sinó que també evidencia el potencial de les IA per abordar tasques complexes i prolongades. Si bé encara no es pot considerar una intel·ligència artificial general, demostra com els models de llenguatge poden adaptar-se i aprendre en entorns estructurats.

Obre un parèntesi en les teves rutines. Subscriu-te al nostre butlletí i posa’t al dia en tecnologia, IA i mitjans de comunicació.

Gerard Quintana

Periodista. M'encanta el periodisme i la tecnologia.

Leave a Reply