Meta planeja el seu retorn a la primera línia de la IA amb models visuals i de codi

Després d’un any marcat per reestructuracions i sortides de talent, Meta prepara una nova ofensiva en intel·ligència artificial. Segons ha filtrat The Wall Street Journal, la companyia està desenvolupant un model generatiu multimodal centrat en imatge i vídeo amb el nom en clau «Mango». El seu llançament estaria previst per a la primera meitat de 2026 i vindria acompanyat d’un segon projecte, «Avocado», orientat al text i la programació.

Una nova aposta sota nova direcció

El desenvolupament forma part de l’estratègia renovada del laboratori Meta Superintelligence Labs (MSL), ara liderat per Alexandr Wang, cofundador de Scale AI. La nova direcció ha redibuixat el full de ruta amb un objectiu clar: crear models capaços de raonar, planificar i actuar en entorns complexos sense necessitat d’haver estat entrenats específicament per a cada cas.

El model Mango se centra en la generació i comprensió de contingut visual, en formats tant d’imatge com de vídeo. No es tracta d’una funció afegida a models de text, sinó de construir una arquitectura genuïnament multimodal.

Què proposa Mango i per què ara

Meta ha quedat endarrerida respecte a altres actors clau en la cursa per la IA generativa. OpenAI amb Sora i GPT-4o, Google amb Gemini i Veo, o Anthropic amb Claude, han liderat la primera línia. Meta, en canvi, ha centrat els seus esforços en integracions dins de les seves pròpies aplicacions, com el xatbot Meta AI o l’eina Imagine per generar imatges.

Amb Mango, la companyia busca recuperar protagonisme i diversificar la seva cartera amb un model visual de nova generació. La seva integració natural seran les plataformes de Meta: Facebook, Instagram i WhatsApp, que funcionen com a banc de proves i xarxa de distribució massiva.

Un laboratori en tensió: sortides i expectatives

Malgrat el nou impuls, l’àrea d’IA de Meta ha viscut un any inestable. Canvis de lideratge, sortida de diversos investigadors cap a altres companyies i la marxa recent de Yann LeCun, fins ara cap científic d’IA a Meta, que ha decidit fundar la seva pròpia empresa emergent. Aquests moviments afegeixen pressió als primers models que emergeixin del Meta Superintelligence Labs han de demostrar que el nou rumb no és només estructural, sinó també tècnicament solvent.

Què se sap realment del model

Encara no s’han publicat arquitectures ni capacitats tècniques detallades. Tampoc s’ha mostrat cap demostració visual de Mango. Només se sap que està dissenyat per treballar amb continguts visuals i que forma part d’una estratègia més àmplia per crear models de «world modeling», és a dir, sistemes capaços d’interpretar el món i actuar en ell amb flexibilitat.

La falta d’informació concreta genera interrogants sobre la solidesa del projecte, especialment en comparació amb rivals que ja han presentat resultats públicament.

El repte de la multimodalitat

La cursa per models capaços d’entendre i generar informació en múltiples formats (text, àudio, imatge i vídeo) s’ha convertit en la nova frontera de la IA. La multimodalitat obre possibilitats que van des de la generació de contingut creatiu fins a sistemes de raonament situacional.

En aquest escenari, Meta aposta fort amb dues cartes Mango i Avocado. Però per ara, juga a porta tancada.

Obre un parèntesi en les teves rutines. Subscriu-te al nostre butlletí i posa’t al dia en tecnologia, IA i mitjans de comunicació.

Tags:

Meta planeja el seu retorn a la primera línia de la IA amb models visuals i de codi

Una nova aposta sota nova direcció

Què proposa Mango i per què ara

Un laboratori en tensió: sortides i expectatives

Què se sap realment del model

El repte de la multimodalitat

Tags:

Aina Vall

Previous PostBBVA i OpenAI multipliquen la seva aposta per la intel·ligència artificial

Next PostEls Estats Units llança la seva aposta científica més gran amb IA, Genesis Mission

Leave a Reply

Qui som

Política de Privadesa

(TikTok)

(YouTube)

(Linkedin)

(Instagram)

(X)