Skip to main content

Microsoft integra el model Sora d’OpenAI en la seva app mòbil, marcant un pas clau en l’expansió de la IA generativa de vídeo per al gran públic

Microsoft ha presentat Bing Video Creator, una eina gratuïta d’intel·ligència artificial que permet generar vídeos de cinc segons a partir de descripcions textuals, sense necessitat de coneixements tècnics avançats. Integrada en l’aplicació mòbil de Bing per a iOS i Android, aquesta funció utilitza el model Sora d’OpenAI, sent la primera vegada que aquesta tecnologia està disponible sense cost per al públic general.

El model Sora, desenvolupat per OpenAI, ha estat reconegut per la seva capacitat per transformar text en vídeos amb un alt grau de coherència visual. Fins ara, el seu ús estava limitat a subscriptors de pagament a través de ChatGPT Plus, però amb aquesta integració, Microsoft el converteix en una eina accessible gratuïtament per a qualsevol usuari d’iOS o Android. Els vídeos generats tenen un format vertical (9:16), optimitzat per a plataformes com TikTok o Instagram, encara que en el mateix anunci avancen que més endavant arribarà el format horitzontal (16:9).

Com funciona i quines limitacions té

El funcionament és simple: des de l’app de Bing, els usuaris poden activar el generador mitjançant un botó en el menú «Creador de vídeos» o escrivint directament comandes com “crear un vídeo de…”. Com més precisa sigui la descripció, millor serà la qualitat del vídeo generat. Malgrat que els resultats encara no assoleixen el nivell de realisme de models com Veo 3 de Google, la senzillesa i gratuïtat de l’eina marquen la diferència.

Bing Video Creator ofereix dos modes de funcionament. L’estàndard, completament gratuït, encara que amb temps d’espera més llargs. I el mode exprés, que permet generar vídeos gairebé a l’instant, però requereix utilitzar 100 punts de Microsoft Rewards per cada creació. Aquests punts formen part del programa de fidelització de Microsoft: els usuaris els acumulen en utilitzar productes de l’empresa, com fer cerques a Bing, comprar a la Microsoft Store o completar activitats promocionals. En iniciar l’ús de l’eina, cada persona rep 10 usos exprés gratuïts (equivalents a 1.000 punts). A més, es poden generar fins a tres vídeos simultàniament, i tots s’emmagatzemen durant noranta dies, temps durant el qual poden descarregar-se o compartir-se lliurement abans de ser eliminats automàticament.

Malgrat que els vídeos mostren limitacions en la fluïdesa de moviments o en la fidelitat dels rostres, la proposta de Microsoft és estratègica: donar accés massiu a una IA de generació audiovisual en un format pràctic i mòbil. Aquest moviment encaixa en una línia més àmplia d’integració d’OpenAI en productes de Microsoft, com Copilot o la generació d’imatges amb DALL·E a Bing.

L’alliberament públic de Sora, encara que en una versió simplificada, suggereix una prova a gran escala per part de Microsoft per mesurar l’impacte d’aquestes eines en l’experiència d’usuari. I mentre gegants com Google afinen els seus models per a cineastes o creadors avançats, Microsoft apunta al públic general, apostant per volum i accessibilitat.

Obre un parèntesi en les teves rutines. Subscriu-te a la nostra newsletter i posa’t al dia en tecnologia, IA i mitjans de comunicació.

Leave a Reply