Google ha fet un pas més en la seva carrera per liderar la intel·ligència artificial multimodal. Des d’aquesta setmana, segons va confirmar el mitjà especialitzat 9to5Google el seu assistent Gemini pot analitzar arxius de vídeo directament des de l’app mòbil, disponible en Android i iOS. Això significa que ara pots pujar un clip des de la teva galeria i preguntar-li a Gemini què apareix a la pantalla, quina hora marca el teu Nest Hub o fins i tot què succeeix en un passeig pel bosc.
Així funciona
La funció s’activa en prémer el botó “+” a la interfície de Gemini. Des d’allà, selecciones un arxiu de vídeo i l’assistent l’analitza. No és necessari cap procés de transcripció prèvia. Gemini interpreta el contingut i respon a les teves preguntes, tot des d’un reproductor de vídeo integrat en la conversa.
Per exemple, pots pujar un fragment d’una reunió gravada i demanar-li que identifiqui qui està parlant, o que resumeixi el contingut visual.
Desplegament gradual i alguns límits
Actualment, la funció està disponible tant per a usuaris gratuïts com de pagament —incloent-hi Gemini 2.5 Flash i Pro—, però només a través de l’app mòbil. La versió web continua sense permetre la càrrega de vídeos, mostrant un missatge de “tipus d’arxiu no compatible”. A més, la funció no grava directament des de la càmera del dispositiu, només analitza clips ja existents.
El llançament també sembla ser parcial. Diversos usuaris han reportat a Reddit que, fins i tot amb arxius en format MP4, l’opció encara no està habilitada en els seus comptes. Tot indica que Google està realitzant un desplegament progressiu, ajustant l’eina abans de la seva implementació global.
Un pas més en l’estratègia Gemini
Aquesta novetat se suma als avenços presentats durant l’esdeveniment Google I/O 2025, on es van revelar funcions com Gemini Live, que permet interacció en temps real amb visió i àudio, així com els projectes Astra, Imagen 4 i Veo 3, orientats a la generació d’imatges i vídeo. Encara que aquestes tecnologies apunten al futur de la IA interactiva, l’anàlisi de clips personals ja disponible reflecteix una aposta concreta per portar aquestes capacitats al dia a dia.
Obre un parèntesi en les teves rutines. Subscriu-te a la nostra newsletter i posa’t al dia en tecnologia, IA i mitjans de comunicació.