Amb la nova app per a macOS, OpenAI deixa de vendre “un copilot” i proposa una altra cosa: gestionar diversos agents en paral·lel sobre el mateix repositori, amb worktrees, skills i automatitzacions —i, de passada, duplica els límits en els plans de pagament.
OpenAI acaba de posar sobre la taula un canvi d’interfície que és, en realitat, un canvi de model mental. Ja no es tracta d’escriure una línia perquè la IA la completi, ni de pair programming amb un únic assistent dins l’IDE. La nova aplicació d’escriptori de Codex per a macOS es presenta com un “centre de comandament per a agents”: un lloc des d’on llançar tasques llargues, dividir la feina, supervisar diffs nets i coordinar múltiples fils d’execució com si fossin membres d’un equip.
El llançament arriba amb dues decisions comercials que apunten a una adopció massiva: durant un temps limitat, Codex també s’inclou per als usuaris de ChatGPT Free i del pla Go, i a més OpenAI duplica els rate limits a Plus, Pro, Business, Enterprise i Edu (segons la nota oficial, l’increment s’aplica “a tot arreu on facis servir Codex”: app, CLI, IDE i núvol).
En paral·lel, el moviment té una lectura competitiva directa: el terreny de les eines de programació és avui el segment més disputat de la IA aplicada a la feina, amb Anthropic guanyant tracció a les empreses i productes com Microsoft mantenint avantatge per integració (GitHub Copilot), mentre els equips busquen productivitat immediata sense refer processos.
D’“assistent” a “equip”: la interfície com a estratègia
La mateixa descripció oficial reconeix que el coll d’ampolla ja no és només què “sap” fer el model, sinó com una persona el pot dirigir a escala. Les eines clàssiques —IDE i terminal— estan pensades per a un humà fent canvis i, com a molt, una IA suggerint. En canvi, quan la IA ja pot executar tasques de principi a fi, el problema passa a ser la coordinació: assignar feines, comparar resultats, evitar conflictes, revisar amb rapidesa i mantenir traçabilitat.
Aquí és on entra l’app: tasques separades en threads per projecte, amb una zona de revisió on inspeccionar canvis, comentar el diff i, si cal, obrir l’editor per a retocs manuals. És a dir: l’aplicació se situa entre el repositori i el desenvolupador com una capa d’orquestració, no com un simple xat.
El missatge és coherent amb el que ha explicat Sam Altman en entrevistes sobre el producte: que internament el consideren el “producte més estimat” i que ell mateix ha fet projectes sense obrir un IDE durant el procés, desplaçant la feina cap a delegació + revisió.
Subagents al mateix directori, sense trepitjar-se: per què importen els worktrees
La peça tècnica que fa creïble el “multiagent” en un repositori real és el suport integrat de worktrees. En termes pràctics: cada agent treballa sobre una còpia aïllada del mateix repo, de manera que pots enviar-ne un a refactoritzar, un altre a escriure tests i un tercer a preparar documentació sense crear un conflicte continu de git. Després compares diffs i decideixes què entra.
Això no és un caprici: és la diferència entre “executar diverses coses” i “poder fer-ho cada dia sense incendiar el repositori”. I, a més, encaixa amb el cas d’ús que menciones (subagents sobre el mateix directori): l’app demana triar una carpeta o repositori local com a “workspace” i, des d’aquí, les tasques s’executen sobre aquest context amb límits i permisos.
Skills: passar d’escriure codi a executar feina
L’altre salt conceptual són les Skills. OpenAI les defineix com paquets d’instruccions + recursos + scripts perquè Codex es pugui connectar amb eines i executar fluxos de treball segons les convencions de l’equip. No és prompt engineering dispers: és convertir procediments repetibles en capacitats invocables.
A la pràctica, això apunta a dues coses:
-
Estandardització interna: el teu equip defineix “com es fan aquí” les coses (nomenclatura, linters, llista de comprovació de PR, desplegaments, estructura de carpetes) i ho encapsula en skills.
-
Extensió a tasques adjacents: disseny (per exemple, aportar context de Figma), gestió (Linear), desplegament (Cloudflare/Vercel) o generació d’assets, tot des del mateix “centre de comandament”, sense haver d’enganxar integracions cada vegada.
La demo que OpenAI fa servir per vendre la idea és significativa: demanar un joc de curses des d’un prompt i deixar que el sistema treballi amb skills d’imatge i desenvolupament web, consumint milions de tokens i validant com a “QA” en jugar-hi. És més màrqueting que benchmark científic, però il·lustra la tesi: un agent no només escriu fitxers; fa servir eines i tanca el bucle de verificació.
Automations: feina “en cua” amb revisió humana
La tercera pota són les Automations: programar tasques repetitives (tria d’issues, resums d’errors de CI, briefs de release, cerques de regressions) i rebre el resultat en una review queue. Internament, l’equip de Codex afirma que ho utilitza per a aquest tipus de feines mecàniques però constants.
El matís important és de disseny: no és “execució cega”, sinó execució amb punt de control humà. L’app està pensada perquè deleguis, però també perquè puguis revertir, editar o rebutjar amb poca fricció.
Seguretat: sandbox per defecte, permisos granulars
Si has de donar autonomia a agents en l’entorn local, la seguretat deixa de ser un epíleg: és arquitectura. OpenAI insisteix en un sandboxing “nadiu” i configurable, amb restriccions per defecte (editar només dins de la carpeta o branch de treball, ús de cerca web en memòria cau, i sol·licitud de permís per a accions elevades com l’accés a la xarxa). A més, remarca que part del sandbox és open source.
En clau empresarial, això respon a una por clàssica: “deixaré que un agent toqui el meu repo i executi comandes?”. L’enfocament de permisos persistents —autoritzar una acció concreta “a partir d’ara” sense obrir la porta a tot— busca l’equilibri entre control i productivitat.
Per què ara: pressió competitiva i despesa enterprise
L’app no apareix en el buit. Una anàlisi recent d’Andreessen Horowitz situa OpenAI com a líder en adopció enterprise (78% dels CIOs enquestats fan servir els seus models en producció), però amb Anthropic creixent ràpid i amb un patró clar: les empreses ja treballen amb múltiples famílies de models, el single vendor perd força i la batalla es decideix per producte + integració + confiança.
En aquest context, una app d’escriptori amb multiagent, worktrees, skills i automatitzacions és una jugada defensiva i ofensiva:
-
Defensiva, perquè evita que “el lloc on programes amb IA” quedi monopolitzat per altres (des de Claude Code fins a eines integrades als IDEs).
-
Ofensiva, perquè desplaça la conversa: no competeix només en “qualitat d’autocompletat”, sinó en “capacitat d’executar feina llarga en paral·lel”, que és on es decideix el ROI per a equips seriosos.
Reuters ho formula amb cruesa: OpenAI busca recuperar terreny en coding, un cas d’ús estrella per vendre IA a empreses, en un mercat on els rivals han guanyat narrativa i quota.
La promoció de límits duplicats no és un regal: és una palanca d’hàbit
La duplicació temporal dels rate limits en plans de pagament i l’obertura a Free/Go no són només màrqueting. En productes d’agents, el cost real per a l’usuari no és “provar-ho una vegada”, sinó construir hàbit: passar d’una tasca a la vegada a moltes tasques concurrents, revisar ràpid, iterar i convertir el sistema en part del flux diari.
Si l’usuari es queda sense límits quan comença a treballar “en paral·lel”, s’estronca l’aprenentatge. Si, en canvi, té marge per llançar diverses tasques i comparar resultats, és més probable que travessi el llindar de “això ja no és una joguina”. La nota oficial ho deixa clar: l’augment de límits s’aplica a totes les superfícies (app, CLI, IDE, núvol) precisament per evitar que l’usuari topi amb parets segons el canal.
macOS avui, Windows demà: el veritable objectiu
L’app s’estrena a Mac i OpenAI confirma que Windows arribarà després. Aquest detall importa per una raó òbvia: el mercat de desenvolupament professional i corporatiu continua molt decantat cap a Windows en molts entorns, i una eina de “centre de comandament” només esdevé estàndard quan és on treballa la massa crítica.
Però l’objectiu de fons va més enllà del sistema operatiu: convertir la programació en la interfície universal per demanar feina a l’ordinador, sigui codi, anàlisi, documentació o tasques operatives. L’app d’escriptori és el primer gest seriós d’“agents com a plantilla”, no com a xat.