Anthropic ha presentat Claude Haiku 4.5. No és el seu model més potent, però sí el més ràpid. Promet fer molt amb poc, moure’s amb soltesa en tasques complexes i costar bastant menys. Un gest gairebé humil dins de la cursa per la intel·ligència artificial total.
Cap en menys, rendeix com més
Haiku 4.5 forma part de la gamma lleugera de Claude. Petit en mida, però no en ambicions. En proves com SWE‑bench Verified (una bateria centrada a resoldre bugs reals en projectes de codi obert), arriba a un 73,3% d’encerts. És a dir, puntua gairebé com els models més grans i cars.
On més destaca, segons Anthropic, és en tasques d’ús d’ordinador. No només respon, mou el cursor, interpreta finestres, executa passos. En interfícies actives, aquesta agilitat importa. I no va sol. En el model col·laboratiu que planteja l’empresa, Sonnet 4.5 descompon la tasca i Haiku 4.5 s’encarrega del treball fi, en paral·lel.
La promesa: ràpid, barat i suficient
El que més crida l’atenció no és el que fa, sinó com ho fa. Anthropic assegura que Haiku 4.5 opera més del doble de ràpid que Sonnet 4 i costa un terç. Menys múscul, més ritme. Està disponible des d’ara mateix a l’app de Claude i via API. També s’integra en Amazon Bedrock i Google Cloud Vertex AI. Per a aquells que fan comptes, surt a $1 per milió de tokens d’entrada, $5 per milió de sortida.
Seguretat: nivell mitjà, riscos baixos (però presents)
Segons l’empresa, Haiku 4.5 va mostrar “taxes baixes de comportaments preocupants” en les seves proves. Afirmen que és més “alineat” que models anteriors o fins i tot que Sonnet 4.5. Se li ha assignat un nivell ASL‑2 de seguretat que significa que els riscos són limitats, encara que no nuls. Aquest matís importa. Fins i tot si no genera instruccions per fabricar armes químiques, el context canvia quan un model es desplega a gran escala. Anthropic diu que Haiku 4.5 no travessa certes línies, però sap que l’entorn és porós. En la seva system card ho detallen tot: des de mètodes d’avaluació fins a escenaris extrems.
Preguntes que continuen flotant
Hi ha entusiasme, sí. Però també dubtes. Les mètriques provenen de proves internes. Les comparacions són, gairebé sempre, dins de casa. I encara que rendeix bé en tasques de terminal, per exemple, encara no arriba del tot a Sonnet 4.5. Es queda a prop de GPT‑5 i Gemini 2.5, però sense superar-los.
Hi ha un altre detall, menys visible. Alguns models, inclòs Claude en versions anteriors, han mostrat que modifiquen el seu comportament si intueixen que són avaluats. Això condiciona els tests de seguretat. La pregunta no és només què fa Haiku 4.5, sinó com ho farà quan ningú el miri.
La cursa per una IA que funcioni (i que pagui sola)
Haiku 4.5 no és un salt al buit, però sí un pas ferm cap a un nou equilibri. Un en què els models no necessiten ser immensos per ser útils. Caldrà veure si el món real ho confirma, o si les promeses es dilueixen quan apareixen les vores del sistema.
Obre un parèntesi en les teves rutines. Subscriu-te al nostre butlletí i posa’t al dia en tecnologia, IA i mitjans de comunicació.