SynthID ja ha marcat més de 100.000 milions de continguts generats per IA, però el veritable salt no és la xifra, sinó l’aliança de Google DeepMind amb OpenAI, ElevenLabs, Kakao i NVIDIA perquè la transparència deixi de dependre d’una sola plataforma.
La intel·ligència artificial generativa ha creat un problema que ja no es pot resoldre només amb educació mediàtica, intuïció visual o advertiments genèrics. Les imatges falses són cada vegada més convincents. Les veus sintètiques imiten accents, tons i emocions. Els vídeos generats per IA comencen a esborrar la frontera entre document, ficció i manipulació. I els textos produïts per models avançats circulen per xarxes, mitjans, cercadors, plataformes educatives i entorns professionals sense un senyal clar sobre el seu origen. En aquest context, Google DeepMind ha fet un pas de gran abast: SynthID, el seu sistema de marca d’aigua invisible per a continguts generats per IA, ja ha marcat més de 100.000 milions de peces i comença a estendre’s més enllà de l’ecosistema Google gràcies a acords amb OpenAI, ElevenLabs, Kakao i NVIDIA.
La frase utilitzada per Google DeepMind resumeix bé el canvi d’escala: la transparència és un esport d’equip. No n’hi ha prou que una empresa marqui els seus propis continguts si la resta de l’ecosistema genera, modifica, descarrega, puja, recomprimeix, retalla i redistribueix imatges, àudios, vídeos i textos sense coordinació. La procedència digital només funciona si el marcatge s’incorpora des de l’origen, si sobreviu a transformacions habituals i si els usuaris tenen eines senzilles per comprovar-ho. Google ho sap i per això intenta convertir SynthID en una infraestructura compartida, no només en una funció més de Gemini, Imagen, Veo o Lyria.
SynthID funciona com una marca d’aigua imperceptible. No afegeix un segell visible en una cantonada ni una etiqueta fàcilment eliminable. Insereix un senyal dins del mateix contingut generat per IA —en píxels, ones d’àudio, text o vídeo— que no hauria d’alterar l’experiència de l’usuari, però que pot ser detectat posteriorment per eines compatibles. Aquesta diferència és decisiva. Les metadades es poden perdre en fer una captura, en reenviar una imatge per una aplicació de missatgeria o en pujar-la a una xarxa social. Una marca incrustada dins del contingut té més possibilitats de sobreviure a compressions, retalls moderats o transformacions comunes.
La xifra de 100.000 milions de continguts marcats indica que la qüestió ha deixat de ser experimental. Google ja utilitzava SynthID en els seus propis productes d’IA generativa, però la novetat és l’ampliació a altres actors. OpenAI incorporarà SynthID com a capa addicional de procedència en imatges generades mitjançant ChatGPT, Codex i la seva API, complementant les credencials C2PA que ja feia servir. ElevenLabs, una de les companyies més influents en generació de veu sintètica, i Kakao, gegant tecnològic sud-coreà, també adoptaran la tecnologia. NVIDIA, per la seva banda, ja havia iniciat el moviment amb el seu ecosistema de models i eines vinculades a generació i simulació.
L’acord amb OpenAI té una càrrega simbòlica evident. Google i OpenAI competeixen en models, assistents, cerca, productivitat, imatge, vídeo i plataformes empresarials. Però en procedència de contingut han decidit alinear-se parcialment. Aquesta cooperació revela una cosa important: cap companyia pot resoldre sola el problema de la confiança digital. Si els principals generadors de contingut sintètic no adopten estàndards interoperables, l’usuari quedarà atrapat en un mosaic de verificadors incompatibles, etiquetes inconsistents i senyals que desapareixen en passar d’una plataforma a una altra.
L’aposta d’OpenAI confirma, a més, un enfocament multicapa. La companyia ha explicat que utilitzarà SynthID juntament amb C2PA, un estàndard de credencials de contingut que permet adjuntar informació sobre l’origen, l’edició i la procedència d’arxius digitals. En termes pràctics, C2PA funciona com una mena de passaport documental: registra qui ha creat o modificat un contingut i amb quines eines. SynthID, en canvi, actua com un senyal incrustat. Un aporta context ric; l’altre aporta més resistència quan les metadades es perden.
La combinació és rellevant perquè l’ecosistema digital real és hostil a la traçabilitat. Els arxius es descarreguen, es capturen, es comprimeixen, s’editen, es reenvien i es publiquen en plataformes que no sempre preserven metadades. Un sistema basat només en etiquetes visibles o en informació adjunta pot fallar ràpidament. Un sistema basat només en marques invisibles pot no tenir prou context per explicar com s’ha creat una peça. Per això la batalla no es guanyarà amb una única tecnologia, sinó amb capes complementàries: marques d’aigua, credencials de contingut, detectors, polítiques de plataforma, etiquetatge visible i alfabetització ciutadana.
Google també està portant la verificació a espais d’ús massiu. Segons la companyia, les eines de comprovació s’integraran en productes com Google Search, Chrome, Google Lens, Circle to Search i l’experiència de Gemini, de manera que l’usuari no hagi d’anar a un portal especialitzat per preguntar si una imatge ha estat generada o modificada per IA. The Verge ha explicat que Google pretén portar aquesta verificació a la navegació i la cerca quotidiana, començant per imatges i ampliant després a altres formats.
Aquest punt pot ser més important que la tecnologia de marcatge. La història d’internet demostra que les eines de seguretat només funcionen si estan integrades en els hàbits reals dels usuaris. Molt poca gent verificarà manualment cada imatge sospitosa en una pàgina externa. En canvi, si la comprovació apareix al navegador, al cercador o en una funció de càmera del telèfon, la fricció baixa dràsticament. La transparència deixa de ser una pràctica d’especialistes i es converteix en una acció disponible per a qualsevol persona.
L’aliança amb ElevenLabs afegeix una altra dimensió: la veu. Durant els últims anys, la generació d’àudio ha avançat fins a permetre imitacions molt convincents de persones reals. Això obre oportunitats legítimes en doblatge, accessibilitat, videojocs, pòdcasts, educació o assistència personalitzada, però també riscos greus: fraus telefònics, suplantació d’identitat, manipulació política, xantatges, estafes familiars i creació de falsos àudios incriminatoris. Marcar àudio sintètic serà una de les tasques més importants de la pròxima etapa de la IA generativa.
La dimensió audiovisual és encara més delicada. A mesura que els models de vídeo generen escenes realistes, la prova visual perd part de la seva autoritat social. Durant dècades, “veure per creure” va ser una intuïció cultural bàsica. Ara comença a ser insuficient. No perquè tot sigui fals, sinó perquè qualsevol cosa podria ser-ho. Aquest dubte generalitzat pot erosionar la confiança pública. El perill no és només que una falsedat sigui creguda, sinó que una veritat real sigui descartada com a possible IA. La marca d’aigua busca respondre a aquest segon risc: protegir la credibilitat d’allò autèntic tant com detectar allò sintètic.
Tanmateix, convé evitar una lectura ingènua. SynthID no resoldrà per si sol el problema dels deepfakes, la desinformació o la manipulació. Les marques d’aigua funcionen millor quan el contingut es genera en sistemes cooperatius que decideixen incorporar-les des de l’origen. Els actors maliciosos poden utilitzar models oberts, eines no alineades, editors que eliminin senyals o mètodes dissenyats per degradar detectors. A més, investigacions acadèmiques han assenyalat que certs sistemes de marcatge textual poden ser vulnerables a paràfrasis, traducció inversa, modificacions semàntiques o reescriptures que redueixin la detectabilitat.
Per això l’adopció industrial és la clau. Com més plataformes importants marquin per defecte les seves sortides, més fàcil serà distingir entre contingut legítimament generat i contingut sospitós sense procedència clara. No s’eliminaran tots els enganys, però s’elevarà el cost d’operar en la foscor. L’absència de marca no provarà automàticament que alguna cosa sigui falsa o maliciosa, però sí que es podrà convertir en un senyal de risc quan el contingut sembli sintètic, viral o potencialment perjudicial.
El moviment té també una dimensió reguladora. La Unió Europea ha incorporat obligacions de transparència per a determinats continguts generats per IA a l’AI Act, especialment quan interactuen amb persones, generen deepfakes o produeixen contingut d’interès públic. Espanya i altres països han començat a debatre sancions per a usos no etiquetats de contingut sintètic. En aquest context, SynthID i C2PA no són només eines tècniques: poden convertir-se en mecanismes de compliment normatiu per a empreses que necessiten demostrar que han etiquetat o marcat adequadament les seves sortides.
La indústria té incentius clars per anticipar-se. Si les empreses d’IA no construeixen sistemes de procedència creïbles, els reguladors imposaran obligacions més dures. Si els usuaris perden la confiança en imatges, àudios i vídeos, el mercat de continguts generatius es pot veure afectat per una sospita permanent. I si els deepfakes danyen eleccions, mercats, reputacions o seguretat pública, la pressió política serà molt més gran. La col·laboració entre competidors busca precisament evitar que la confiança digital col·lapsi abans que existeixin estàndards estables.
També hi ha una batalla de poder. Qui controli els sistemes de procedència pot influir en la infraestructura de confiança de la xarxa. Si SynthID es converteix en un estàndard de facto, Google DeepMind guanya una posició estratègica en la verificació de continguts sintètics. La companyia ho presenta com una col·laboració oberta i necessària, però continua sent una tecnologia desenvolupada per un actor dominant de l’ecosistema digital. La governança d’aquestes eines haurà de ser transparent, auditada i interoperable per evitar que la solució a la desinformació generi noves dependències privades.
La comparació amb C2PA és útil. C2PA neix com un estàndard obert recolzat per múltiples organitzacions per registrar credencials de contingut. SynthID, tot i expandir-se mitjançant aliances, prové de Google DeepMind. Ambdues aproximacions poden conviure, però la confiança pública exigirà claredat: qui pot verificar, quines dades es recullen, com es protegeix la privacitat, què passa amb falsos positius o falsos negatius, quines garanties existeixen contra abusos i com s’evita que una marca d’aigua es converteixi en mecanisme de vigilància o control indegut.
La privacitat és un punt sensible. Marcar contingut generat per IA no hauria de significar rastrejar permanentment usuaris o creadors. Una cosa és permetre que algú sàpiga si una imatge ha estat produïda per un model; una altra de molt diferent és crear sistemes que identifiquin cada pas de circulació d’un arxiu o revelin informació innecessària sobre persones. La procedència ha d’equilibrar transparència i drets. Si no ho fa, pot generar rebuig entre creadors, periodistes, activistes, artistes o usuaris que temen una web excessivament vigilada.
L’adopció per part de Kakao apunta a un altre element: la internacionalització. La confiança digital no es pot construir només des de Silicon Valley. Els continguts sintètics circulen per mercats lingüístics, culturals i regulatoris molt diferents. Corea del Sud, Europa, Estats Units, Índia, Amèrica Llatina o Japó tenen ecosistemes mediàtics, jurídics i polítics diferents. Si les marques d’aigua aspiren a ser infraestructura global, hauran de funcionar en múltiples idiomes, formats, plataformes i jurisdiccions.
NVIDIA aporta una peça diferent: la infraestructura de generació i simulació. La companyia no només ven xips; desenvolupa models, eines, plataformes i entorns per a IA física, robòtica, vídeo, mons sintètics i simulació. Si el marcatge s’incorpora en nivells profunds de la cadena de producció, no només en aplicacions finals, la procedència pot ser més robusta. La transparència no s’hauria d’afegir al final com una etiqueta cosmètica, sinó integrar-se en l’arquitectura de generació.
La qüestió central és que la web sintètica serà massa gran per verificar-se manualment. Si cada dia es generen milions o milers de milions d’imatges, àudios, vídeos i textos, la resposta no pot dependre d’equips humans revisant cas per cas. Cal infraestructura automàtica, interoperable i distribuïda. SynthID intenta ocupar aquest espai: un senyal invisible que viatgi amb el contingut i pugui ser llegit en contextos quotidians.
Però fins i tot aquesta infraestructura necessitarà cultura pública. Els usuaris hauran d’entendre que una marca d’aigua no equival a una garantia de veritat. Un contingut pot ser generat per IA i ser legítim, creatiu, satíric, educatiu o publicitari. També pot ser real i estar manipulat mitjançant edició convencional. La pregunta “està generat per IA?” no substitueix “és veritable?”, “qui ho difon?”, “amb quina intenció?” o “quina evidència ho sosté?”. El marcatge ajuda, però no substitueix el criteri.
Per als mitjans de comunicació, aquesta transició serà decisiva. Les redaccions hauran d’incorporar verificadors de procedència en els seus fluxos de treball, especialment davant imatges i vídeos virals. Les agències hauran d’etiquetar material sintètic. Les plataformes hauran de decidir com mostrar senyals d’IA sense saturar l’usuari. I els periodistes hauran d’explicar les limitacions d’aquests sistemes per evitar falses certeses. La transparència tècnica només serà útil si es tradueix en pràctiques editorials comprensibles.
Per als creadors, la situació és ambivalent. D’una banda, les marques d’aigua poden protegir-los davant usos enganyosos i ajudar a diferenciar obra humana, obra assistida i obra generada. De l’altra, alguns temeran que l’etiquetatge d’IA estigmatitzi continguts legítims o redueixi el seu valor percebut. La indústria cultural haurà de construir convencions noves: quan declarar ús d’IA, com distingir assistència de generació completa, què significa autoria i com s’informa el públic sense simplificacions.
La xifra de 100.000 milions funciona com un senyal que l’escala ja és planetària. Però la dada important no és només quants continguts han estat marcats, sinó quants podran ser reconeguts allà on circulin. Una marca que només pot llegir-se dins d’una plataforma té un valor limitat. Una marca que pot verificar-se des de cercadors, navegadors, aplicacions de càmera, eines professionals i plataformes socials canvia les regles del joc.
La conclusió és clara: Google DeepMind no està simplement ampliant SynthID; està intentant convertir-lo en una capa de confiança per a la web generativa. La incorporació d’OpenAI, ElevenLabs, Kakao i NVIDIA mostra que fins i tot competidors ferotges entenen que la transparència no pot ser una guerra de marques. La IA generativa ha fet que produir contingut sigui més fàcil que mai. Ara la batalla és fer que el seu origen no desaparegui pel camí.
El futur d’internet no dependrà només de models més potents, vídeos més realistes o veus més convincents. Dependrà de si la societat aconsegueix saber quan es troba davant d’una creació humana, una creació sintètica, una barreja de totes dues o una manipulació maliciosa. SynthID no és la resposta definitiva, però sí una peça important d’aquesta nova arquitectura. En l’era de l’abundància artificial, la confiança serà tan valuosa com el contingut.