Amb Claude Fable 5 i Claude Mythos 5, Anthropic obre una nova etapa en la intel·ligència artificial: ja no es tracta només de llançar el model més potent, sinó de decidir qui pot utilitzar les seves capacitats més perilloses i sota quines condicions.
Anthropic acaba de moure una de les peces més delicades del tauler de la intel·ligència artificial. La companyia ha anunciat el llançament de Claude Fable 5 per al públic general i Claude Mythos 5 per a organitzacions de confiança, una decisió que resumeix el gran dilema de la IA avançada: com alliberar models cada vegada més capaços sense posar en mans de qualsevol eines que podrien utilitzar-se per trobar vulnerabilitats, dissenyar atacs informàtics o accelerar amenaces en camps sensibles.
La notícia ha estat avançada per WIRED sota el titular “Anthropic Releases Claude Fable 5 and Mythos 5”, amb una idea central molt cridanera: Anthropic assegura que Claude Fable 5, la versió disponible per al públic, no es pot utilitzar per a ciberatacs perquè incorpora salvaguardes específiques per bloquejar o redirigir aquest tipus de sol·licituds.
El moviment és molt més que un llançament de producte. És una declaració estratègica sobre el futur de la intel·ligència artificial de frontera. Anthropic no està presentant simplement un model més ràpid, més intel·ligent o més competitiu davant OpenAI, Google o Meta. Està assajant una arquitectura d’accés diferenciada: una versió pública amb capacitats molt avançades però amb filtres reforçats, i una altra versió més completa, Claude Mythos 5, reservada per a socis verificats dins de Project Glasswing, el programa de la companyia per reforçar les defenses de ciberseguretat en infraestructures crítiques.
La distinció entre Fable i Mythos és la clau. Segons Anthropic, tots dos comparteixen el mateix model subjacent. La diferència no estaria en el “cervell” del sistema, sinó en les barreres que es col·loquen al voltant de determinades capacitats. Claude Fable 5 és el model que s’obre al públic. Claude Mythos 5 és la versió amb algunes salvaguardes aixecades, especialment en l’àmbit de la ciberseguretat, i per això només s’ofereix inicialment a un grup reduït d’organitzacions, defensors informàtics, proveïdors d’infraestructura i socis vinculats a Glasswing.
Aquesta divisió inaugura una forma de governança pràctica de la IA: no tots els usuaris reben el mateix model en les mateixes condicions. Fins ara, moltes discussions sobre seguretat es plantejaven de manera binària: alliberar o no alliberar, obrir o tancar, publicar o retenir. Anthropic proposa una via intermèdia. El model pot arribar al públic, però les seves capacitats més sensibles s’encapsulen, es redirigeixen o es limiten. Qui necessiti accés complet per motius defensius haurà de passar per programes de confiança.
La pregunta és si aquest equilibri funcionarà.
Claude Fable 5 arriba amb una promesa ambiciosa. Anthropic el presenta com el seu model més capaç àmpliament disponible, dissenyat per a tasques exigents de raonament, programació, anàlisi, visió, memòria de llarg context i treball agèntic prolongat. La companyia assegura que pot operar durant més temps de manera autònoma que models anteriors de Claude, mantenir-se enfocat en tasques de milions de tokens i resoldre problemes complexos de programari, finances, investigació científica i anàlisi documental.
En programació, Anthropic destaca avaluacions internes i externes en què Fable 5 apareix com un model especialment fort per a tasques d’enginyeria de programari. La companyia cita casos de clients com Stripe, que hauria utilitzat el model per comprimir en dies treballs de migració de codi que normalment haurien requerit mesos d’un equip humà. També afirma que Fable 5 millora l’eficiència en tokens respecte a models anteriors, un punt rellevant perquè el cost de la IA empresarial no depèn només del preu nominal per milió de tokens, sinó de quants tokens necessita un model per completar una tasca.
En coneixement expert, Anthropic situa Fable 5 com un model sòlid per a raonament financer, interpretació de documents, gràfics i taules, resolució de problemes i tasques analítiques complexes. En visió, el presenta com un sistema capaç d’extreure números precisos de figures científiques detallades, reconstruir codi font d’una aplicació web a partir de captures de pantalla i completar tasques visuals que abans exigien més eines auxiliars.
La companyia també subratlla el paper de la memòria i del context llarg. Fable 5 compta amb una finestra de context d’un milió de tokens i una sortida màxima de 128.000 tokens a l’API. Això el situa en la categoria de models dissenyats no només per respondre preguntes puntuals, sinó per treballar amb projectes extensos, repositoris grans, documents complexos i tasques que requereixen continuïtat.
Però el veritable debat no és en aquestes capacitats generals, sinó en aquelles que Anthropic ha decidit restringir.
Project Glasswing va néixer precisament perquè Claude Mythos Preview havia mostrat habilitats molt superiors en ciberseguretat. Anthropic va explicar a l’abril que els seus models de frontera ja eren capaços de llegir i raonar sobre codi amb una eficàcia inquietant, detectar vulnerabilitats i, en alguns casos, desenvolupar formes d’explotar-les. Segons la companyia, Mythos Preview va arribar a trobar milers de vulnerabilitats de dia zero en sistemes operatius, navegadors i programari àmpliament utilitzat, incloses fallades que havien sobreviscut durant anys a revisions humanes i proves automatitzades.
Aquesta dada canvia la naturalesa del debat. Una IA capaç de trobar vulnerabilitats profundes pot ser una eina extraordinària per a defensors, governs, empreses tecnològiques i responsables d’infraestructures crítiques. Però també pot ser una eina perillosa si cau en mans d’atacants. La mateixa capacitat que permet localitzar errors per corregir-los es pot utilitzar per explotar-los abans que siguin corregits.
Aquí rau la paradoxa de Mythos.
Anthropic sosté que Claude Mythos 5 té les capacitats de ciberseguretat més fortes de qualsevol model del món. Precisament per això no l’obre al públic. L’ofereix a organitzacions seleccionades dins de Project Glasswing, en col·laboració amb el Govern dels Estats Units, i preveu ampliar l’accés mitjançant un programa de confiança. A la pràctica, això significa que empreses d’infraestructura, socis de seguretat i organitzacions verificades podran utilitzar Mythos 5 per trobar i corregir vulnerabilitats, mentre que l’usuari general rebrà Fable 5, amb restriccions més fortes.
La versió pública, Fable 5, incorpora classificadors de seguretat que detecten sol·licituds en àrees d’alt risc, com la ciberseguretat, la biologia, la química o la destil·lació de models. Quan aquests classificadors s’activen, el sistema redirigeix la petició a un model més conservador, Claude Opus 4.8, o bloqueja l’assistència en funció del risc. Anthropic admet que aquestes salvaguardes s’han ajustat de manera conservadora i que de vegades poden capturar sol·licituds innocents.
L’afirmació que Fable 5 «no es pot utilitzar per a ciberatacs» s’ha d’entendre en aquest context. No significa que el model no tingui capacitats tècniques. Al contrari: Fable 5 comparteix arquitectura amb Mythos 5 i és extraordinàriament potent. El que Anthropic defensa és que el sistema públic està dissenyat per impedir que aquestes capacitats s’apliquin a usos perillosos.
La gran qüestió és si aquest model de desplegament serà suficient en un mercat on la competència empeny cap a l’obertura, la velocitat i la reducció de costos. Si funciona, Fable i Mythos podrien convertir-se en una referència per a futurs llançaments d’IA d’alt risc. Si falla, obriran una pregunta encara més incòmoda: què fer quan els models més útils per defensar-nos són també els més perillosos en mans equivocades.
La intel·ligència artificial entra així en una fase de maduresa incòmoda. Ja no n’hi ha prou amb celebrar que els models raonin millor, programin millor o vegin millor. Ara cal decidir qui pot utilitzar aquestes capacitats, amb quines finalitats i sota quins límits. Anthropic acaba de posar sobre la taula una resposta: dos noms, un mateix motor i una frontera de seguretat entre el públic i les capacitats crítiques.