NotebookLM entra en terreny audiovisual: Google converteix apunts, PDFs i vídeos en peces amb un clic

La novetat de NotebookLM no és només que resumeixi informació: ara també l’empaqueta com a vídeo, amb formats que van des de presentacions narrades fins a peces “cinematogràfiques”, i això canvia de manera radical com s’estudia, es presenta i es redistribueix coneixement.

Google fa temps que intenta que NotebookLM deixi de ser vist com una simple llibreta amb IA i passi a ocupar un lloc molt més ambiciós: el d’una màquina de comprensió, síntesi i reempaquetatge del coneixement. La nova fase d’aquesta estratègia és audiovisual. NotebookLM ja no es limita a resumir documents, generar guies d’estudi o produir àudios a l’estil podcast. També crea vídeos explicatius a partir de les fonts que l’usuari puja al seu quadern, i ho fa amb una lògica que encaixa força bé amb l’economia actual de l’atenció: menys text lineal, més condensació visual, més narrativa empaquetada i més facilitat per convertir materials densos en peces consumibles. Google ho articula al voltant dels seus Video Overviews, i més recentment ha fet un salt addicional amb els Cinematic Video Overviews, una versió més elaborada i visualment molt més ambiciosa d’aquesta funció.

La formulació més simple seria dir que NotebookLM “fa vídeos en segons”, però aquesta frase, encara que útil com a ganxo, es queda curta i també pot resultar equívoca. El que realment fa NotebookLM és transformar un conjunt de fonts —PDF, apunts, presentacions, pàgines web, i també URLs públiques de YouTube— en un vídeo narrat i estructurat per IA. En alguns casos l’experiència pot semblar gairebé immediata; en d’altres, la mateixa ajuda oficial de Google adverteix que la generació pot trigar força més i fins i tot superar els 30 minuts. És a dir, la clau no és només la velocitat, sinó el canvi de format: NotebookLM converteix materials de lectura o visionat en una explicació visual nova, generada a partir de les fonts que l’usuari ja ha reunit.

Aquest matís importa perquè situa NotebookLM en una categoria diferent de la d’un editor de vídeo clàssic i també diferent de la d’un xatbot tradicional. No som davant d’una eina pensada per muntar clips originals des de zero, com passa amb altres propostes de vídeo generatiu. Tampoc davant d’un simple resum textual adornat amb imatges. Google va presentar el juliol de 2025 els seus Video Overviews com una nova categoria dins del panell Studio de NotebookLM, concebuda com una alternativa visual als Audio Overviews. En aquella fase inicial, el format consistia en diapositives narrades creades per IA, amb suport d’imatges, diagrames, cites i xifres extretes dels documents de l’usuari, especialment útils per explicar processos, dades i conceptes abstractes.

L’evolució més recent va força més enllà. Google va anunciar fa pocs dies que NotebookLM incorporava Cinematic Video Overviews, una actualització que “va més enllà de les diapositives narrades” per generar vídeos més immersius i amb una posada en escena molt més sofisticada. Segons la mateixa companyia, aquesta nova versió es basa en una combinació de models com Gemini 3, Nano Banana Pro i Veo 3, amb Gemini actuant com una mena de director creatiu que pren decisions d’estructura, estil visual i format narratiu, i fins i tot refina la seva pròpia feina per mantenir la consistència. Aquesta descripció no és un detall menor: suggereix que Google ja no entén el vídeo de NotebookLM com una simple funció d’estudi, sinó com una forma de producció multimodal on la IA decideix no només què explicar, sinó també com explicar-ho visualment.

L’arquitectura del producte ajuda a entendre per què aquesta funció té tant potencial. NotebookLM va néixer com una eina per treballar a partir de fonts pròpies. No és una IA que respon només des del seu coneixement general, sinó un entorn on l’usuari reuneix materials i després interroga, resumeix, connecta i transforma aquests materials. El setembre de 2024, Google va ampliar aquesta lògica en permetre afegir URLs públiques de YouTube i arxius d’àudio com a fonts del quadern. Des d’aleshores, NotebookLM pot analitzar vídeos i classes gravades, recolzant-se en les seves transcripcions i generant respostes amb cites vinculades a la font. Aquest pas va ser important perquè va obrir el sistema a un tipus de contingut que ja dominava bona part de l’aprenentatge informal a internet: tutorials, conferències, entrevistes, classes i xerrades tècniques.

La incorporació del vídeo generat a aquest mateix flux multiplica l’efecte. Abans, l’usuari podia pujar un vídeo de YouTube com a font per entendre’l millor. Ara, a més, pot agafar aquest conjunt de materials —inclòs aquest vídeo, juntament amb PDFs, documents o notes pròpies— i demanar a NotebookLM que construeixi una nova peça audiovisual que reorganitzi tot el contingut. En altres paraules: l’eina ja no només ajuda a analitzar una font audiovisual; també ajuda a produir una nova síntesi visual a partir de diverses fonts heterogènies. Aquesta transició, de consumir a recompondre, és probablement la part més rellevant del salt de producte.

Google ha estructurat aquesta capacitat en diversos formats, i això també mereix atenció. L’ajuda oficial explica que, en generar un Video Overview, l’usuari pot personalitzar paràmetres com format, idioma, estil visual i altres instruccions. Entre els formats hi apareixen Explainer, pensat com una visió estructurada i comprensiva del contingut; Brief, concebut com una càpsula més ràpida i concentrada; i Cinematic, reservat de moment a usuaris majors de 18 anys amb Google AI Ultra, i per ara només en anglès. A més, per a alguns formats es pot escollir un estil visual concret o fins i tot descriure’n un de personalitzat. Això significa que NotebookLM ja no entrega un únic tipus de vídeo-resum, sinó que comença a comportar-se com una interfície d’adaptació narrativa. El mateix material pot convertir-se en explicació extensa, resum ràpid o peça audiovisual més immersiva segons l’objectiu.

Aquest punt connecta amb una tendència més gran dins de la IA aplicada al coneixement: la idea que ja no n’hi ha prou amb recuperar informació, també cal redissenyar-la per a diferents contextos de consum. Un mateix dossier pot necessitar un informe per llegir, un mapa mental per explorar, un àudio per escoltar mentre es camina o un vídeo per presentar un tema complex de manera digerible. NotebookLM fa mesos que es mou exactament en aquesta direcció. L’actualització del juliol de 2025 no només va introduir els Video Overviews, sinó també un Studio redissenyat on conviuen Audio Overviews, vídeo, mapes mentals i altres formats, amb capacitat fins i tot per generar diverses sortides del mateix tipus dins d’un mateix quadern. Més que una llibreta assistida per IA, el que Google està construint és una fàbrica de formats a partir d’una mateixa base documental.

Aquí rau bona part de l’interès estratègic del producte. El gran coll d’ampolla del treball intel·lectual no és únicament trobar informació; és traduir-la a la forma adequada per a cada moment. Llegir un paper tècnic no és el mateix que preparar una classe, explicar un procediment a un equip, estudiar per a un examen o compartir una síntesi amb una audiència general. NotebookLM entra precisament aquí: automatitza part de la transformació de format. Quan un conjunt de fonts es pot convertir en àudio, mapa, esquema o vídeo, el que s’automatitza no és només el resum, sinó la re-mediació del coneixement. És una capa diferent de valor, molt més propera a l’edició intel·lectual que a la mera cerca.

També convé mirar aquesta novetat des de la perspectiva de Google, no només de l’usuari final. NotebookLM competeix en un terreny on ja no n’hi ha prou amb tenir un bon model lingüístic. La batalla és construir entorns on la IA no sigui només conversa, sinó flux de treball. I el vídeo té un pes especial en aquesta estratègia perquè uneix diverses de les àrees on Google vol marcar terreny: models multimodals, ecosistema educatiu, productivitat, YouTube com a infraestructura de font i generació audiovisual assistida per IA. Que la companyia combini en els Cinematic Video Overviews Gemini 3, Nano Banana Pro i Veo 3 no és només una decisió tècnica; és també una manera d’exhibir la interoperabilitat interna del seu stack de models.

Des del punt de vista de l’ús real, la promesa és evident. Un estudiant pot pujar apunts, PDFs i una classe a YouTube i obtenir una peça visual que sintetitzi l’essencial. Un professional pot agafar documentació dispersa i transformar-la en un vídeo de context per a un equip. Un creador pot convertir recerca prèvia en una versió més presentable o compartible. Un docent pot reorganitzar materials densos en un format més accessible. Google, de fet, presenta NotebookLM tant com a eina de recerca com d’estudi, i la seva mateixa pàgina destaca la possibilitat de convertir documents en Video Overviews per comprendre idees clau de manera visual.

Però també hi ha límits que no convé ignorar. La mateixa ajuda oficial de Google avisa que els vídeos, incloent-hi veus i visuals, són generats per IA i poden contenir inexactituds o errors d’àudio. Aquesta advertència és fonamental, perquè recorda que el vídeo generat no s’ha de confondre amb una representació fidel i automàtica del contingut font sense marge d’error. Com més convincent és la forma audiovisual, més important resulta mantenir una distància crítica respecte a la seva exactitud. El risc aquí no és només que la IA s’equivoqui, sinó que un vídeo ben narrat i visualment atractiu augmenti la sensació de fiabilitat fins i tot quan simplifica massa, omet matisos o introdueix errors.

Aquest problema no invalida l’eina, però sí que desplaça la conversa. NotebookLM no s’hauria d’entendre com a substitut de la font, sinó com una màquina de primera passada: una manera de reorganitzar un corpus per comprendre’l, explicar-lo o decidir després què cal revisar amb més deteniment. El vídeo pot estalviar molt temps en la fase d’entrada a un tema, però no elimina la necessitat de tornar als materials originals quan el context exigeix precisió, contrast o responsabilitat professional. De fet, la proposta de valor de NotebookLM continua depenent en gran mesura d’aquesta relació amb les fonts: sintetitza, sí, però sintetitza sobre materials que l’usuari ha decidit reunir i sobre els quals pot tornar amb cites i referències.

Hi ha un altre aspecte menys visible però molt rellevant: la normalització del vídeo com a forma de sortida nativa de la IA. Durant molt de temps, eines d’aquest tipus oferien respostes en text i, més tard, en àudio. Que ara el vídeo es converteixi en una opció integrada dins del mateix entorn indica un canvi cultural més ampli. La IA ja no es limita a contestar; també empaqueta coneixement en els formats que dominen el consum contemporani. I entre aquests formats, el vídeo ocupa un lloc central. No només perquè sigui més atractiu per a molts usuaris, sinó perquè permet condensar narració, jerarquia visual i ritme en una sola peça.

Vist així, la pregunta de fons no és si NotebookLM “fa vídeos en segons”, sinó què significa que una eina de recerca pugui transformar qualsevol dossier en un producte audiovisual gairebé sota demanda. La resposta apunta a diverses direccions alhora. En educació, pot accelerar la creació de materials de repàs. En coneixement professional, pot facilitar presentacions internes i transferència de context. En creació de contingut, pot abaratir la fase de prototipatge explicatiu. I en la pròpia estratègia de Google, converteix NotebookLM en una cosa més potent que una llibreta intel·ligent: l’acosta a una plataforma de traducció multimodal del coneixement.

També hi ha una ironia interessant en tot això. NotebookLM va començar sent una eina força austera, gairebé de nínxol, dirigida a persones que volien estudiar o pensar millor amb les seves pròpies fonts. El seu atractiu residia precisament en aquesta sobrietat: menys espectacle, més utilitat. Però la incorporació de vídeo —i especialment de versions “cinematogràfiques”— introdueix una capa nova d’ambició. Google ja no vol només ajudar-te a entendre els teus materials; vol ajudar-te a produir una versió visualment narrada d’aquests materials. Això amplia el mercat potencial del producte i, al mateix temps, en modifica la identitat. NotebookLM comença a assemblar-se menys a una llibreta i més a un estudi de postproducció cognitiva assistida per IA.

En última instància, això és el que fa interessant aquesta actualització. No es tracta simplement que Google hagi afegit “una altra funció” a NotebookLM. Es tracta que ha fet un pas més en una direcció molt concreta: convertir la recerca personal i professional en matèria primera per a múltiples sortides, inclosa l’audiovisual. El vídeo aquí no és un adorn. És una forma de compressió, presentació i circulació del coneixement. I quan una eina pot agafar les teves fonts, entendre-les, sintetitzar-les i convertir-les en una peça explicativa amb veu, estil i narrativa, la frontera entre estudiar, investigar, presentar i publicar comença a estrènyer-se força.

Tags:

NotebookLM entra en terreny audiovisual: Google converteix apunts, PDFs i vídeos en peces amb un clic

La novetat de NotebookLM no és només que resumeixi informació: ara també l’empaqueta com a vídeo, amb formats que van des de presentacions narrades fins a peces “cinematogràfiques”, i això canvia de manera radical com s’estudia, es presenta i es redistribueix coneixement.

Tags:

Paréntesis MEDia

Previous PostRicard Gómez (UOC): “La intel·ligència artificial obliga a repensar com funcionen les organitzacions”

Next PostYann LeCun, el dissident central de la IA: per què Europa continua mirant el seu gran heterodox tecnològic

Leave a Reply

Qui som

Política de Privadesa

(TikTok)

(YouTube)

(Linkedin)

(Instagram)

(X)