Claude Opus 4.5, la nova IA d'Anthropic aposta per tasques reals en codi i oficina

Anthropic ha presentat Claude Opus 4.5, el seu model d’IA més avançat fins ara. Segons l’empresa, aquest sistema millora significativament en tasques com programació, agents autònoms i ús d’oficina (fulls de càlcul, presentacions), i marca una nova fase en el que les IA poden fer en l’àmbit professional.

Dissenyat per pensar i fer

Claude Opus 4.5 està construït per raonar, planificar i executar tasques complexes amb intervenció humana mínima. La seva arquitectura permet manejar contextos llargs (fins a 200 000 tokens en proves internes), cosa que facilita sessions extenses sense perdre coherència. Introdueix a més un nou paràmetre, effort (esforç en anglès), que permet ajustar el nivell d’«esforç cognitiu» que el model aplica, o més ràpid o més profund, segons la necessitat.

El que promet: de codi a Excel

Entre les millores destacades, Opus 4.5 mostra un saltar en tasques de programació. En el benchmark «SWE-bench Verified», supera a versions anteriors de Claude i a diversos competidors. A més, optimitza l’ús de tokens, cosa que significa menys cost per tasca. La integració amb eines d’oficina també millora. Ara pot interactuar amb fulls de càlcul, preparar documents o mantenir sessions llargues sense talls. El model ja està disponible via API, aplicacions d’escriptori i plataformes com Amazon Bedrock. També redueix preus: US$ 5 per milió de tokens d’entrada i US$ 25 per milió de sortides.

Dades i entorn sota el capó

Anthropic no detalla tots els conjunts de dades emprats, però afirma que Opus 4.5 millora en visió, matemàtiques i raonament enfront dels seus predecessors. En entorns de desenvolupament, permet usar eines externes, retenir informació entre passos i gestionar interaccions múltiples. La memòria operativa, el maneig del context i la capacitat per usar funcions s’han reforçat per respondre a usos més exigents.

Les tensions d’una IA més autònoma

Darrere de les millores, també sorgeixen dilemes. L’enfocament en agents i eines planteja reptes d’alineació: fins a on es pot confiar en les seves decisions? Anthropic sosté que és el seu model «més robustament alineat», i afirma haver reforçat la defensa contra atacs com el prompt injection. No obstant això, l’ampliació de l’accés i la baixada de preus podria accelerar la seva adopció sense suficient supervisió. Això planteja preguntes sobre el seu impacte en rols professionals, especialment en enginyeria de programari.

On es situa davant dels seus rivals

Comparat amb Claude Opus 4.1, la versió 4.5 millora en eficiència de tokens i qualitat de sortida. Davant de models com GPT-4.5 o Gemini 3 Pro, es posiciona com fort en fluxos de treball amb eines i agents autònoms, encara que els seus rivals destaquen en tasques multimodals o de raonament en brut. En codi rutinari, algunes anàlisis suggereixen que les diferències ja són mínimes.

Obre un parèntesi en les teves rutines. Subscriu-te al nostre butlletí i posa’t al dia en tecnologia, IA i mitjans de comunicació.

Tags:

Claude Opus 4.5, la nova IA d’Anthropic aposta per tasques reals en codi i oficina

Dissenyat per pensar i fer

El que promet: de codi a Excel

Dades i entorn sota el capó

Les tensions d’una IA més autònoma

On es situa davant dels seus rivals

Tags:

Aina Vall

Previous PostChatGPT es converteix en el teu company de compres amb “Shopping Research”

Next PostGoogle introdueix anuncis en el «Mode IA» del cercador

Leave a Reply

Qui som

Política de Privadesa

(TikTok)

(YouTube)

(Linkedin)

(Instagram)

(X)

Claude Opus 4.5, la nova IA d’Anthropic aposta per tasques reals en codi i oficina

Dissenyat per pensar i fer

El que promet: de codi a Excel

Dades i entorn sota el capó

Les tensions d’una IA més autònoma

On es situa davant dels seus rivals

Tags:

Previous PostChatGPT es converteix en el teu company de compres amb “Shopping Research”

Next PostGoogle introdueix anuncis en el «Mode IA» del cercador

Leave a Reply

Previous PostChatGPT es converteix en el teu company de compres amb “Shopping Research”