Skip to main content

ChatGPT ara dibuixa més de pressa, amb més precisió i sense sortir-se del guió. Amb el llançament de GPT Image 1.5, OpenAI no només actualitza la seva eina de generació i edició d’imatges. Declara, sense dir-ho, que aquesta batalla per la IA visual es juga de debò. I ve amb context. El nou model neix després d’una ordre interna de “code red”, en resposta a l’avanç de Google amb el seu model Nano Banana Pro, amb la idea de recuperar terreny i tornar a marcar el ritme.

Un clic més a prop del que imaginaves

GPT Image 1.5 no canvia l’essència —escriure per generar imatges— però afina el que passa després. La promesa és doble, primer entendre millor el que li demanes i en acabat respectar el que no hauria de canviar. Si abans demanar “ajusta l’expressió” podia acabar redibuixant la cara sencera, ara el sistema sap mantenir els trets. Il·luminació, enquadrament, tons: tot es manté al seu lloc, tret que diguis el contrari.

I ho fa en una quarta part del temps. La generació és fins a quatre vegades més ràpida. Això canvia el ritme. Pots provar, corregir, tornar a intentar, sense sentir que estàs esperant que acabi de pensar.

Una interfície que se sent com un estudi, no com un xat

Hi ha alguna cosa nova també en la forma d’usar-lo. ChatGPT ara inclou una pestanya visual dedicada. Des d’allà, els usuaris poden començar des d’una imatge, explorar filtres prearmats o usar prompts suggerits. Es pot crear des de zero o editar el que ja tens.

Fidji Simo, CEO de productes a OpenAI, ho descriu com “un estudi creatiu” dins de ChatGPT. No cal ser dissenyador ni dominar comandaments: n’hi ha prou amb assenyalar què vols veure, i veure què passa.

Més enllà del filtre bonic

L’eina ja no és només per “crear una imatge bonica”. Permet transformacions més profundes com convertir una escena normal en un cartell de pel·lícula, reimaginar un lloc amb un altre estil, o mantenir la cara d’algú mentre canvia tot el que l’envolta. Aquest nivell de control, abans limitat a professionals amb programari especialitzat, ara es redueix a una conversa.

Pressió competitiva en segon pla

OpenAI no anava a llançar aquesta actualització tan aviat. Segons TechCrunch, el pla original era esperar a gener. Però el context va canviar. Google venia de presentar Gemini 3 i la nova versió del seu generador visual, ambdós superant benchmarks clau. L’ordre interna va ser accelerar.

Així va néixer GPT Image 1.5. No com a experiment, sinó com a resposta tàctica. Un moviment que busca mostrar que OpenAI no només té un model de llenguatge fort, sinó també una proposta visual amb múscul.

Què es comparteix? Només el que tu puges

Quant a dades, l’edició funciona amb imatges que tu carregues i els textos que escrius. No accedeix a altres fonts sense el teu permís, i manté el focus en edicions controlades per l’usuari. La moderació de contingut i els límits tècnics continuen en vigor, encara que OpenAI no detalla quins conjunts de dades entrenen el model visual.

I ara què?

GPT Image 1.5 ja està disponible per a usuaris de ChatGPT a Espanya (en web i app) i també via API per a empreses. S’integra amb GPT-4 i forma part del desplegament de noves capacitats visuals que OpenAI prepara per als pròxims mesos.

Obre un parèntesi en les teves rutines. Subscriu-te al nostre butlletí i posa’t al dia en tecnologia, IA i mitjans de comunicació.

Leave a Reply