Claude Mythos Preview no es presenta com el pròxim chatbot de consum, sinó com un avís: Anthropic sosté que els seus models ja han assolit un nivell de capacitat ofensiva en ciberseguretat que obliga a reorganitzar la defensa del software mundial.
La pàgina que Anthropic ha publicat sota el nom de Project Glasswing no és un simple anunci de producte. És, en realitat, una declaració estratègica sobre el moment en què entra la intel·ligència artificial aplicada a la ciberseguretat. La companyia presenta una iniciativa que reuneix grans actors tecnològics i industrials per utilitzar Claude Mythos Preview en tasques defensives orientades a protegir el “software més crític del món”. Anthropic assegura que aquest model, encara no llançat de forma general, ja ha trobat milers de vulnerabilitats d’alta gravetat, incloent-hi falles en tots els grans sistemes operatius i en tots els grans navegadors web.
Això canvia completament el marc habitual amb què es presenten els nous models d’IA. Aquí no hi ha focus en redacció, cerca o productivitat personal. Hi ha una tesi molt més contundent: la companyia creu que la capacitat dels models per trobar i explotar vulnerabilitats ja supera la de gairebé tots els humans, excepte els especialistes més avançats, i que aquest avantatge tècnic es pot estendre ràpidament fora d’entorns controlats. Per això Glasswing neix com una resposta preventiva, no com una expansió comercial convencional. Anthropic compromet fins a 100 milions de dòlars en crèdits d’ús del model i 4 milions en donacions a organitzacions de seguretat open source per accelerar aquesta defensa abans que aquestes capacitats es difonguin sense salvaguardes suficients.
El nucli del missatge es troba en Claude Mythos Preview. Anthropic el defineix com un model frontier de propòsit general, no publicat, el rendiment del qual en ciberseguretat deriva de millores més àmplies en raonament, codificació agentiva i autonomia. És a dir, la companyia insisteix que no el va entrenar específicament per atacar sistemes, sinó que la seva potència ofensiva emergeix com a conseqüència de fer-ho molt millor en comprendre software complex, modificar-lo, raonar sobre ell i actuar durant processos llargs amb poca o cap supervisió humana.
Anthropic aporta diversos exemples per sostenir aquesta afirmació. Assegura que Mythos Preview va trobar una vulnerabilitat de 27 anys en OpenBSD, una de 16 anys en FFmpeg i diverses falles encadenades en el kernel de Linux que permetien escalar privilegis fins al control total del sistema. També afirma que el model ha identificat vulnerabilitats de dia zero en tots els grans sistemes operatius i navegadors. Segons els seus equips, el model ha arribat a construir exploits complexos amb una autonomia elevada.
El més inquietant no és només la detecció de vulnerabilitats, sinó la seva explotació automatitzada. Anthropic indica que el model pot filtrar vulnerabilitats, prioritzar-les i generar codi d’explotació funcional sense intervenció humana significativa. Això implica un canvi profund: ja no es tracta només d’ajuda a l’auditoria, sinó d’automatització de capacitats ofensives avançades.
Els benchmarks reforcen aquesta idea, mostrant millores significatives respecte a models anteriors en tasques de programació, seguretat i resolució de problemes complexos. Malgrat això, Anthropic deixa clar que no planeja una disponibilitat general del model a causa dels riscos associats.
Aquest punt és clau. En una indústria orientada a l’expansió ràpida, Anthropic opta per restringir l’accés. Mythos Preview queda reservat a un grup limitat d’organitzacions dins de Glasswing i a actors vinculats a infraestructures crítiques. L’objectiu és desenvolupar un marc segur abans de desplegar capacitats similars de manera més àmplia.
Project Glasswing no és només un programa de col·laboració, sinó una arquitectura industrial i política. Anthropic intenta construir un ecosistema defensiu al voltant de la IA avançada, anticipant un escenari on la ciberseguretat dependrà cada vegada més d’aquest tipus de models.
El software lliure ocupa un lloc central en aquesta estratègia. La companyia reconeix que gran part de la infraestructura global depèn de projectes open source amb recursos limitats. Per això destina fons a organitzacions que reforcen la seguretat d’aquest ecosistema.
També hi ha una dimensió geopolítica clara. Anthropic vincula aquestes capacitats amb la seguretat nacional i amb la necessitat de mantenir avantatge tecnològic en l’àmbit de la IA. Això situa Mythos Preview en la intersecció entre tecnologia, defensa i política global.
En aquest context, Claude Mythos Preview no és un producte convencional. És una demostració de fins on ha arribat la IA i dels riscos associats. Funciona com una prova de tensió del sistema.
El moviment també posiciona Anthropic com un actor que prioritza la seguretat. Això pot interpretar-se com responsabilitat, però també com estratègia per liderar el debat sobre el control de la IA.
La gran incògnita és si aquesta resposta arriba a temps. Anthropic creu que encara és possible reforçar la defensa, però adverteix que el desenvolupament tecnològic avança molt més ràpid que les mesures de seguretat.
Aquesta asimetria és el punt central: si la IA accelera la descoberta de vulnerabilitats, la defensa haurà d’accelerar-se al mateix ritme.
Glasswing és el primer intent coordinat d’aconseguir-ho. Mythos Preview és la prova que el temps per reaccionar s’està esgotant.