Skip to main content

L’anunci de Satya Nadella no presenta només un nou model visual: confirma que Microsoft vol reduir la dependència de tecnologia aliena i començar a situar els seus propis models al cor de Copilot, Bing Image Creator i, ben aviat, dels fluxos empresarials sobre Foundry.

La publicació de Satya Nadella sobre MAI-Image-2 pot semblar, a primera vista, un missatge breu més dins del ritme accelerat de llançaments del sector. Però llegida amb deteniment, conté una senyal estratègica molt més profunda. Quan el conseller delegat de Microsoft celebra que “el nostre nou model d’imatge” de l’equip de Superintelligence ja s’està desplegant a Copilot i que arribarà aviat a Foundry per a clients empresarials, no està parlant només de creativitat visual ni d’una millora incremental. Està marcant direcció: Microsoft vol que la seva infraestructura d’IA sigui cada cop menys un aparador de models aliens i més una plataforma sustentada en tecnologia pròpia, integrada en producte, mesurable en ús real i preparada per monetitzar-se en entorns corporatius.

Aquest context és clau perquè MAI-Image-2 no neix en el buit. Microsoft va presentar oficialment el model el 19 de març de 2026 com una aposta clara per la generació d’imatges orientada a treball creatiu real. Segons la companyia, el sistema s’ha dissenyat escoltant fotògrafs, dissenyadors i creadors visuals, amb un focus explícit en el fotorealisme, la il·luminació natural, els tons de pell més precisos, la coherència de les escenes i la utilitat pràctica per reduir tasques de postproducció. El llenguatge no és casual: Microsoft no ven un simple experiment visual, sinó un actiu de producció.

Mustafa Suleyman reforça aquesta lectura en presentar MAI-Image-2 com un generador disponible al MAI Playground, capaç d’anar des del realisme fotogràfic fins a infografies detallades. A més, vincula el model amb el progrés del seu equip de Superintelligence, una etiqueta que defineix una ambició més gran: construir una línia pròpia de models potents, comercialment útils i profundament integrats en l’ecosistema Microsoft. Nadella ho deixa clar en destacar el desplegament immediat a Copilot i l’arribada imminent a Foundry per a empreses.

Aquí hi ha el nucli industrial del moviment. Durant anys, Microsoft ha estat vista com la gran aliada d’OpenAI. Aquesta relació ha estat una enorme avantatge competitiva, però també ha generat dependència. La reorganització interna recent apunta a una nova fase: Microsoft vol desenvolupar models propis per tenir més control sobre el seu futur tecnològic. MAI-Image-2 és una peça clau d’aquest gir.

El model no només s’ha anunciat, sinó que arriba amb credencials competitives. Microsoft afirma que ja es troba entre els tres principals laboratoris de generació d’imatge segons Arena.ai, per darrere de Google i OpenAI. Això no és un detall menor: en una indústria dominada pels rànquings, entrar al podi és una manera de guanyar legitimitat tècnica. Tanmateix, cal llegir-ho amb precisió: la posició és preliminar i la distància amb els líders encara existeix. Microsoft ja és a la partida, però encara no lidera.

La integració en Copilot i Bing Image Creator respon a una lògica clara: la distribució massiva. Un model no té valor real fins que s’utilitza a escala. Copilot permet a Microsoft recollir dades d’ús, millorar qualitat i consolidar hàbits. Això reforça la seva posició davant rivals com Google o OpenAI. Però el veritable moviment estratègic és Foundry.

Quan Nadella parla de portar el model a Foundry, està apuntant al mercat més rendible: l’empresa. Aquí la generació d’imatges deixa de ser un recurs creatiu puntual i es converteix en infraestructura: màrqueting, e-commerce, presentacions, formació, branding. Microsoft ja ha començat amb clients com WPP, i preveu obrir l’accés via API a més desenvolupadors. Això transforma el model en producte comercial escalable.

Aquest enfocament també explica l’èmfasi en seguretat i governança. El model inclou sistemes per evitar continguts nocius i garantir un ús responsable. En entorns empresarials, això és essencial: no n’hi ha prou amb qualitat visual, cal fiabilitat i control.

El moviment arriba en paral·lel a una reorganització interna important. Microsoft està separant clarament dues prioritats: millorar Copilot com a producte i construir una base pròpia de models. MAI-Image-2 encaixa perfectament en ambdues línies.

Tot això apunta a una idea central: la sobirania tecnològica. Controlar els models significa controlar costos, evolució i diferenciació. Microsoft vol reduir la seva dependència d’OpenAI i guanyar autonomia. MAI-Image-2 no és només un model: és una peça d’aquesta estratègia.

També és un moviment de posicionament. Google, OpenAI i altres competidors estan avançant ràpid. Entrar al top 3 és una declaració clara: Microsoft vol competir al màxim nivell.

Ara bé, el veritable test encara està per venir. El rendiment real en entorns empresarials, la consistència, la integració i la confiança determinaran l’èxit del model. Microsoft ho sap i per això el desplegament és progressiu.

El concepte de “Superintelligence” afegeix una capa narrativa ambiciosa. Serveix per posicionar el projecte com a part d’una visió de futur, però també eleva les expectatives. El mercat exigirà resultats.

En definitiva, el missatge de Nadella no és només un anunci tecnològic. És una declaració estratègica: Microsoft vol passar de ser integrador a productor de models. MAI-Image-2 és un primer pas visible cap a aquesta nova etapa.

Leave a Reply