OpenAI ha presentat Sora 2, la segona versió del seu model de generació de vídeo amb àudio que arriba acompanyat d’una aplicació social pensada per experimentar i compartir. El primer model de Sora va sortir al febrer de 2024 i va arribar a Espanya uns mesos més tard. Si aquell primer Sora
OpenAI Sora 2 generació de vídeo amb àudio
Un esbós ple de promeses, aquesta segona versió busca consolidar-se convertint la paraula en imatge i so amb la mateixa naturalitat amb què una idea es converteix en record.
Un motor que entén el món
La diferència amb el Sora original es percep en els detalls. El nou model entén la gravetat, la inèrcia i la continuïtat entre plans. Ja no improvisa salts impossibles ni objectes que es desfiguren en moure’s. Ara una tombarella sembla gravada en un gimnàs i una pilota rebota amb lògica pròpia. Aquesta versemblança és el que el separa dels experiments anteriors.
L’altre salt està en l’àudio. Veus que es sincronitzen amb llavis, ambients que sonen al que mostren i efectes que acompanyen sense grinyolar. Del realisme a l’anime, la paleta sonora s’ajusta al guió escrit en poques frases. Un relat que ja no només es veu, sinó que també s’escolta.
La promesa de la col·laboració
L’estrena no és només tècnica. L’app que l’acompanya es presenta com un espai social. Els vídeos no acaben quan es generen, sinó que queden oberts a la remescla. Algú afegeix un gir, un altre canvia l’estil, i el resultat s’assembla més a un collage col·lectiu que a una peça tancada. La creació es converteix en diàleg.
Aquí s’insereix una altra novetat: els cameos. Gravar un gest o una veu perquè aparegui en una escena generada. Sempre amb consentiment explícit, sempre amb l’opció de revocar. Una resposta directa al fantasma dels deepfakes, encara que no elimina del tot les preguntes sobre identitat digital i control de la mateixa imatge.
This is the Sora app, powered by Sora 2.
Inside the app, you can create, remix, and bring yourself or your friends into the scene through cameos—all within a customizable feed designed just for Sora videos.
See inside the Sora app pic.twitter.com/GxzxdNZMYG
— OpenAI (@OpenAI) September 30, 2025
Dades, entrenament i límits
Sora 2 es va entrenar amb volums massius de vídeo acompanyats de descripcions textuals, un mètode que reforça la fidelitat a les instruccions. També incorpora filtres d’entrada i moderació de sortida per reduir riscos. Tot i això, els errors es mantenen, objectes que es fonen, cossos que perden proporció o moviments que no acaben de quallar. OpenAI els reconeix i els exhibeix com a part de l’aprenentatge.
Cada clip generat porta la seva signatura, marques d’aigua visibles, metadades sota l’estàndard C2PA i rastres interns. I per ara, no es permet carregar imatges realistes de persones. La restricció reflecteix fins a quin punt la frontera entre creació i manipulació continua sent fràgil.
Preguntes que s’obren
La funció, cameo tanca un dilema evident. Què significa cedir el mateix rostre, encara que sigui per uns segons? I quin marge real de control queda una vegada altres poden reinterpretar-lo? De la mateixa manera, les marques de traçabilitat ajuden a identificar l’origen, però no impedeixen que els vídeos circulin editats fora de l’ecosistema oficial.
Els menors són una altra preocupació explícita. L’app introdueix límits de scroll, filtres de contingut i controls parentals. Un recordatori que la combinació d’imatge i so generats necessita més barreres que les habituals.
Un mercat en cursa
Sora 2 no apareix en buit. Google empeny amb el seu model Veo 3 i startups com Runway o Luma es disputen la mateixa atenció. El diferencial sembla estar en la sincronia entre imatge i so, i aquí OpenAI aposta per integrar Sora en l’ecosistema de ChatGPT, amb l’avantatge d’un marc de seguretat que busca marcar estàndards. Encara que, com en tota cursa, el que avui és avantatge demà pot ser rutina.
El que queda en joc
L’aplicació debuta en iOS, només per invitació als EUA i Canadà, amb plans d’expansió progressiva. S’ofereix gratis amb límits d’ús i, en paral·lel, una versió Pro vinculada a ChatGPT per a aquells que paguin la subscripció. Una estratègia de desplegament lent, assaig i correcció.
Obre un parèntesi en les teves rutines. Subscriu-te al nostre butlletí i posa’t al dia en tecnologia, IA i mitjans de comunicació.