Zoom resol l'examen més exigent de la intel·ligència artificial

La plataforma que molts associen amb reunions remotes acaba de marcar un hito inesperat en el camp de la intel·ligència artificial. Zoom ha anunciat que el seu sistema d’IA ha superat a tots els competidors en una de les proves més exigents del sector: Humanity’s Last Exam.

Una prova dissenyada per fer ensopegar les màquines

Humanity’s Last Exam (HLE) no és una prova qualsevol. Reunida per experts en educació i ciència computacional, aquesta avaluació planteja milers de preguntes de nivell universitari en disciplines tan variades com matemàtiques, biologia, dret o filosofia. Més que mesurar coneixements, HLE avalua la capacitat de raonar, sintetitzar i argumentar, just el que fins fa poc separava els humans dels sistemes automatitzats.

Una IA que pensa en equip

El sistema de Zoom no és un model monolític. Funciona amb una arquitectura federada que combina diferents models de llenguatge i estratègies de resolució. El procés es divideix en tres fases: exploració, verificació i federació. En la primera, diversos models proposen possibles respostes. En la segona, se sotmeten a un escrutini creuat per descartar errors lògics. Finalment, el sistema integra les millors aportacions en una resposta definitiva.

Aquesta arquitectura es basa en un sistema de selecció anomenat Z-scorer, que orquestra models propis de Zoom juntament amb sistemes avançats desenvolupats per altres laboratoris. Una estratègia híbrida que aprofita el millor de cada model per a tasques específiques.

Amb aquesta metodologia, Zoom va aconseguir una puntuació del 48,1 % en l’examen complet. Això suposa un salt significatiu respecte al 45,8 % assolit per Gemini 3 Pro amb eines, el model més avançat de Google fins a la data.

Dades, context i memòria a llarg termini

Aquest enfocament no només millora la precisió en tasques complexes. També permet gestionar millor el context i realitzar operacions que requereixen memòria a llarg termini. El sistema de Zoom pot sintetitzar documents extensos, detectar contradiccions internes i extreure accions clau amb una capacitat pròxima a la d’un assistent humà expert.

Dels laboratoris a l’ús quotidià

Segons la companyia, aquesta tecnologia ja està integrada en els seus productes de comunicació i productivitat sota la marca AI Companion 3.0. Entre altres funcions, permet generar resums de reunions, anticipar temes crítics en converses i automatitzar fluxos de treball. La idea és traslladar aquestes capacitats al dia a dia de milions d’usuaris.

La versió 3.0 introdueix a més un gir cap a assistents més autònoms. Inclou capacitats per transformar suggeriments en accions concretes, gestionar tasques dins i fora de Zoom i adaptar-se a fluxos de treball complexos. També afegeix compatibilitat amb plataformes externes com Google Meet o Microsoft Teams, ampliant l’abast d’aquesta IA més enllà de l’ecosistema propi de Zoom.

Una cursa que ja no és només de gegants

Fins ara, les grans marques del sector —Google, OpenAI, Anthropic— dominaven els titulars sobre avenços en IA. El cas de Zoom introdueix una variable nova: empreses centrades en productivitat també poden innovar en intel·ligència general. La clau no està només en la mida dels models, sinó en com s’orquestren diferents peces.

Encara que la marca celebra el seu assoliment, el lideratge ja és discutit. L’eina DeepWriter assegura haver assolit un 50,91 % en el mateix benchmark al novembre. I la versió més recent de GPT-5.2 ja ha arribat al 50 %. En aquest context, el marge és estret i canviant. Tot i així, l’enfocament federat comença a perfilar-se com una via atractiva per a empreses que volen capacitats avançades sense desenvolupar els seus propis models des de zero.

Preguntes que segueixen obertes

Zoom no ha publicat la metodologia completa utilitzada en l’avaluació ni els pesos individuals dels models implicats. Com en altres fites recents, la transparència segueix sent un deute pendent. La comunitat investigadora espera detalls abans de validar plenament els resultats.

Però el resultat ja està sobre la taula. I obliga a replantejar què significa avui «raonar» per a una màquina.

Obre un parèntesi en les teves rutines. Subscriu-te al nostre butlletí i posa’t al dia en tecnologia, IA i mitjans de comunicació.

Tags:

Zoom resol l’examen més exigent de la intel·ligència artificial

Una prova dissenyada per fer ensopegar les màquines

Una IA que pensa en equip

Dades, context i memòria a llarg termini

Dels laboratoris a l’ús quotidià

Una cursa que ja no és només de gegants

Preguntes que segueixen obertes

Tags:

Aina Vall

Previous PostNvidia es llança a la IA oberta amb Nemotron 3

Next PostUna filtració que obre tres camins cap al futur d'Apple

Leave a Reply

Qui som

Política de Privadesa

(TikTok)

(YouTube)

(Linkedin)

(Instagram)

(X)