Skip to main content

ETH Zürich i EPFL estan a punt de llançar un model de llenguatge de gran escala i completament obert. Això significa que no només es podrà utilitzar, sinó també examinar, modificar i reutilitzar: el codi, les dades i els pesos del model estaran disponibles per a tothom.
Va ser entrenat al superordinador Alps, una infraestructura pública situada a Suïssa, i representa una de les apostes més ambicioses d’Europa en IA. Hi ha dues versions: una amb 8.000 milions de paràmetres i una altra amb 70.000 milions. Mides comparables als grans models comercials, però sense restriccions d’accés.

Més de 1.500 llengües, des del principi

No és un model entrenat en anglès i traduït després. Des de la primera línia de codi, la diversitat era part del pla. Prop del 40% del corpus d’entrenament està en altres idiomes. En total, més de 1.500 llengües presents, encara que no s’ha especificat públicament quines són, i per ara es desconeix el detall de les llengües concretes incloses. No es tracta només d’incloure, sinó de representar.

El múscul és públic, i es refrigera amb aigua del llac

L’entrenament es va fer a “Alps”, el superordinador del CSCS a Lugano. Funciona amb més de 10.000 xips Grace Hopper de NVIDIA, refrigerats mitjançant un sistema que utilitza aigua del llac de Lugano, cosa que redueix l’impacte ambiental i alimentats amb electricitat 100% renovable. Ni núvols privats, ni servidors llunyans. Tot el procés, des del maquinari fins al programari, es queda a casa.

Dissenyat per ser entès

Cada línia de codi, cada font de dades, cada decisió tècnica serà pública. El model es llança amb llicència Apache 2.0, una de les més obertes. S’ajusta a les lleis suïsses i al marc legal europeu, inclosos els requisits del futur AI Act. I el signen més de 800 investigadors, com a part de la iniciativa Suïssa d’IA. No és només ciència. És estratègia.

IA oberta, amb accent europeu

Suïssa no competeix per volum, sinó per direcció. Mentre altres models s’entrenen a porta tancada, aquest s’obre des de dins. Amb infraestructura pública, dades auditables i un enfocament multilingüe, proposa una altra manera de fer intel·ligència artificial. Una que no depengui de permisos, contractes o caixes negres.

El que comença ara

En les setmanes vinents es publicaran els pesos i el codi del model. Serà el moment de provar-lo, comparar-lo, veure què sap fer i què no. Però el moviment ja està fet: una IA gran, oberta i multilingüe, construïda amb recursos públics i energia neta.

Obre un parèntesi en les teves rutines. Subscriu-te al nostre butlletí i posa’t al dia en tecnologia, IA i mitjans de comunicació.

Obre un parèntesi en les teves rutines. Subscriu-te al nostre butlletí i posa’t al dia en tecnologia, IA i mitjans de comunicació.

Leave a Reply