Skip to main content

OpenAI ha anunciat GPT-5.1-Codex-Max, un model dissenyat per actuar com a agent autònom en tasques complexes de programació. Capaç de treballar durant hores, refactoritzar grans repositoris i mantenir coherència al llarg de milions de tokens, representa una nova fase en l’automatització del desenvolupament de programari. El model no només raona, també recorda, resumeix i avança sense demanar permís.

Compactar per recordar millor

L’element tècnic clau s’anomena compaction. Cada model de llenguatge té un límit de memòria operativa amb un màxim de tokens que pot tenir «presents» en cada operació. Codex-Max introdueix una tècnica per comprimir parts antigues de l’historial sense perdre informació clau. Aquesta compressió permet que l’agent mantingui context durant sessions de treball esteses, sense caure en repeticions ni inconsistències.

Un assistent que treballa sense pausa

Codex-Max està pensat per a tasques de llarg alè com depurar errors durant hores, mantenir converses tècniques, escriure i reescriure funcions fins a passar proves. En les proves internes d’OpenAI, el model ha treballat més de 24 hores sense supervisió directa. A més, el seu ús de tokens ha estat optimitzat, ara consumeix un 30% menys que la seva versió anterior per a tasques similars. A partir d’avui està disponible en entorns com la línia d’ordres, extensions IDE i revisors de codi.

Context tècnic i entorn segur

El model ha estat entrenat amb exemples reals d’enginyeria de programari com revisions de codi, creació de pull-requests, interfícies frontend i sessions de preguntes tècniques. Pel que fa a seguretat, s’executa per defecte en un entorn aïllat, l’accés a arxius i xarxes està restringit tret que l’usuari ho habiliti, cosa que redueix riscos d’execució no desitjada o filtracions de dades.

Autonomia, però amb vigilància

Encara que Codex-Max pot raonar i prendre decisions, OpenAI recomana tractar-lo com un revisor addicional, no com a substitut humà. El model encara no assoleix el nivell «alt» en ciberseguretat segons el seu propi sistema d’avaluació. A més, la tècnica de compaction planteja una qüestió sobre si el model resumeix parts de l’historial, què queda fora? La transparència sobre quina informació reté i quina descarta serà clau per confiar en el seu ús en entorns crítics.

Un moviment en la cursa pel codi autònom

Codex-Max millora els resultats del seu antecessor en proves com SWE-bench Verified (79,9% enfront de 66,3%) i arriba just quan Google presenta Gemini 3 Pro. La competència per construir agents capaços de programar de forma autònoma s’accelera. Però els experts en avaluació d’IA, com METR, adverteixen que no es tracta d’una ruptura radical, l’avanç és sostingut, no miraculós.

Què hi ha al final del cicle llarg

GPT-5.1-Codex-Max avança en direcció a agents que col·laboren en projectes complexos, sense necessitat de repetir cada pas. La pregunta no és només què pot fer, sinó què hauríem de deixar-li fer. La programació del futur podria no tenir pauses, però el judici humà continuarà marcant el pas.

Obre un parèntesi en les teves rutines. Subscriu-te al nostre butlletí i posa’t al dia en tecnologia, IA i mitjans de comunicació.

Leave a Reply