El model obert i multilingüe d’ETH Zurich i EPFL ja es pot descarregar, provar i adaptar
Es va anunciar com una raresa, un model de llenguatge multilingüe entrenat en un superordinador públic, amb totes les seves dades obertes i sense barreres d’ús. Avui ja és una realitat. Apertus, la IA suïssa dissenyada com a infraestructura pública, ha estat llançada oficialment. I ara no es parla de promeses, sinó d’accessos reals, aplicacions immediates i preguntes que comencen a concretar-se.
Què es pot fer des d’ara
Apertus ja està disponible a Hugging Face i a la plataforma d’inferència pública d’ETH Zurich i CSCS. També des de Swisscom, encara que en aquest cas, limitat a usuaris dins de Suïssa. Hi ha dues versions per triar: una més lleugera (8B) i una altra més potent (70B). Ambdues es poden descarregar, integrar en productes o utilitzar directament des de web, sense pagar ni demanar permís.
I ja estan sorgint les primeres proves. Des de xatbots en romanx, models jurídics en francès suís, resums en alemany dialectal… La comunitat educativa l’està explorant per crear assistents multilingües a classe. Algunes startups de salut i legaltech ja l’han citat com a base per als seus propers pilots.
Què es confirma del model
Apertus es va entrenar, com es va prometre, amb més de 15 bilions de tokens i textos en més de mil idiomes. Almenys un 40 % no estan en anglès. Els responsables han confirmat que sí es va incloure contingut en suís alemany, romanx i altres idiomes minoritaris, cosa que el converteix en el model més divers en la seva base lingüística fins ara.
Els pesos del model, els checkpoints, les instruccions d’entrenament i el conjunt de dades estan tots publicats. La llicència Apache 2.0 continua vigent, cosa que permet fins i tot ús comercial, sempre que es mencioni l’autoria. I les barreres tècniques s’han reduït, ja hi ha imatges Docker llestes per utilitzar sense complicacions.
El que canvia ara que està disponible
Amb el model ja al carrer, canvia el tipus de discussió. Ja no es debat si és possible una IA pública, sinó com es gestiona. Quin tipus de projectes l’faran servir primer? Quins límits ètics apareixen quan qualsevol persona pot descarregar un model potent, entrenar-lo amb noves dades i desplegar-lo sense control?
ETH Zurich ha publicat una guia d’ús responsable i manté filtres a la interfície pública. Però si algú clona el model i l’adapta per desinformació, no hi haurà fre immediat. Aquesta és la tensió de fons, el radical de l’obertura també implica deixar anar el control.
Primeres comparatives: com es comporta?
Apertus no supera models com GPT-4 en precisió o context, però competeix en multilingüisme i transparència. Les primeres proves indiquen que en tasques en alemany suís o francès suís ofereix resultats més naturals que models nord-americans, perquè va ser entrenat amb corpus locals reals.
En tasques generals, el seu rendiment és sòlid però no punter. No té funcions avançades com navegació web o raonament multimodal. Però sí que té quelcom que els grans no: la possibilitat d’auditar-lo línia per línia, adaptar-lo sense restriccions i desplegar-lo en infraestructures pròpies.
Què comença a moure’s al seu voltant
En les properes setmanes se celebraran les Swiss {ai} Weeks, on Apertus serà el nucli de hackatons, tallers i proves de camp. L’objectiu no és només mostrar el model, sinó animar a universitats, municipis, startups i col·lectius a construir sobre ell. També s’esperen forks temàtics com: Apertus Salut, Apertus Jurídic, Apertus Educació.
I al marge de Suïssa, ja hi ha centres a Barcelona, Hèlsinki i São Paulo que estan provant-lo com a alternativa a models tancats en projectes públics.
Obre un parèntesi en les teves rutines. Subscriu-te al nostre butlletí i posa’t al dia en tecnologia, IA i mitjans de comunicació.