Skip to main content

Microsoft ha anunciat el llançament dels seus primers models d’intel·ligència artificial (IA) desenvolupats completament internament, marcant un avanç estratègic cap a una major autonomia tecnològica. Sota la nova marca Microsoft AI (MAI), es van presentar dos models clau: MAI-Voice-1, especialitzat en generació de veu; i MAI-1-preview, un model de llenguatge dissenyat per respondre a consultes quotidianes amb fluïdesa i estil conversacional.

El primer, MAI-Voice-1, destaca per la seva eficiència: és capaç de generar un àudio d’un minut en menys d’un segon utilitzant només una GPU, una capacitat que el posiciona com un dels sistemes de síntesi més ràpids fins a la data. Actualment, ja està integrat en funcionalitats com Copilot Daily —on un presentador IA recita titulars— i en format d’estil pòdcast.

En paral·lel, MAI-1-preview representa el primer model generatiu de text entrenat completament en infraestructura pròpia, sense dependre d’OpenAI. Entrenat amb aproximadament 15 000 GPUs Nvidia H100, el model es troba en fase de prova pública en la plataforma d’avaluació LMArena, i està previst que complementi els models d’OpenAI dins de Copilot.

Mustafa Suleyman, cap de Microsoft AI, va subratllar que l’enfocament de l’empresa està orientat a l’usuari final (“consumer”), aprofitant dades d’ús reals per optimitzar l’experiència de l’usuari en lloc de centrar-se únicament en aplicacions empresarials. A més, va expressar la intenció de Microsoft d’“orquestrar una gamma de models especialitzats per a diferents usos i necessitats”, anticipant un ecosistema més modular i diversificat.

Aquest moviment arriba en un context on Microsoft ha invertit milers de milions en OpenAI, consolidant una relació històrica. No obstant això, la creació de MAI reflecteix un desig per diversificar les seves fonts d’IA, reduint la dependència de tercers i assegurant major control tècnic, econòmic i estratègic. A més, segons l’Economic Times, MAI neix com a resposta a una estratègia que busca “tallar la seva dependència del fabricant de ChatGPT” i consolidar el seu propi lideratge.

En resum, Microsoft fa un moviment agosarat: llança els seus propis models de veu i llenguatge internament, amb alt rendiment i orientats a l’ús quotidià, mentre continua treballant amb OpenAI. Aquesta dualitat suggereix una estratègia híbrida que combina exclusivitat tecnològica amb suport generatiu ja consolidat.

Obre un parèntesi en les teves rutines. Subscriu-te al nostre butlletí i posa’t al dia en tecnologia, IA i mitjans de comunicació.

Leave a Reply