Skip to main content

El Projecte Panamà revela fins a quin punt la cursa per entrenar models d’IA ha convertit els llibres en matèria primera: Anthropic va comprar, desmuntar, escanejar i reciclar milions d’exemplars físics per alimentar Claude i defensar que aquell ús era legal.

La història té alguna cosa de metàfora brutal: una empresa d’intel·ligència artificial compra milions de llibres de paper, talla els lloms, escaneja les pàgines i envia les restes al reciclatge perquè el seu model aprengui a escriure. No és una distòpia literària ni una exageració dels crítics de Silicon Valley. És el nucli de l’anomenat Projecte Panamà, l’operació d’Anthropic per reunir una enorme biblioteca digital destinada a l’entrenament de Claude, segons documents judicials desclassificats i publicats ara per WIRED.

El cas mostra una de les paradoxes més incòmodes de la intel·ligència artificial generativa: els models capaços de produir textos fluids, raonaments complexos, resums, articles, diàlegs i codi necessiten haver estat entrenats amb quantitats massives de llenguatge humà. I bona part d’aquest llenguatge prové d’obres escrites per autors, periodistes, acadèmics, traductors, editors i creadors que mai no van imaginar que els seus llibres acabarien convertits en combustible estadístic per a sistemes comercials.

Anthropic, creadora de Claude i presentada durant anys com una de les companyies més preocupades per la seguretat i l’ètica de la IA, queda ara situada al centre d’una batalla que va molt més enllà del seu cas. El debat no és només si una empresa pot entrenar models amb obres protegides per drets d’autor. La qüestió de fons és qui controla la memòria escrita de la humanitat, sota quines condicions pot ser processada per màquines i quina compensació mereixen els qui van produir aquests continguts.

El Projecte Panamà resulta especialment cridaner perquè no es va limitar a descarregar textos d’internet. Segons els documents citats per WIRED i per informacions prèvies de The Washington Post, Anthropic va comprar grans quantitats de llibres físics, els va desmembrar per facilitar-ne la digitalització, va escanejar les pàgines i va eliminar els exemplars originals mitjançant reciclatge. L’operació buscava construir una biblioteca interna per entrenar models sense dependre exclusivament de còpies piratejades o de bases de dades d’origen dubtós.

Aquí apareix el matís legal decisiu. El juny de 2025, el jutge federal William Alsup, del Districte Nord de Califòrnia, va dictaminar en el cas Bartz v. Anthropic que l’entrenament de Claude amb llibres adquirits legalment podia considerar-se “fair use” sota la legislació nord-americana. És a dir, l’ús transformatiu d’aquests textos per entrenar un model no equivalia necessàriament a una infracció directa del copyright. Tanmateix, el mateix jutge va distingir aquest supòsit d’un altre molt més problemàtic: la descàrrega i emmagatzematge de milions de llibres piratejats en una biblioteca centralitzada.

La diferència és essencial. Per al tribunal, no era el mateix comprar un llibre, escanejar-lo de manera destructiva i utilitzar-lo internament per entrenar un model, que descarregar milions d’obres des de biblioteques pirates com LibGen o PiLiMi i conservar-les com a repositori corporatiu. Aquesta segona conducta va obrir la porta a una responsabilitat molt més gran i va acabar desembocant en un acord de 1.500 milions de dòlars amb autors i titulars de drets, aprovat de manera preliminar el 2025.

El resultat és jurídicament complex i culturalment explosiu. D’una banda, Anthropic va obtenir una victòria important per a la indústria de la IA: l’entrenament amb obres adquirides legalment pot ser considerat ús legítim als Estats Units. De l’altra, el cas confirma que la procedència de les dades importa. No n’hi ha prou amb dir que un model “aprèn” dels textos; cal explicar com es van obtenir, com es van emmagatzemar, amb quina finalitat i si els titulars dels drets van ser ignorats o compensats.

La imatge dels llibres destruïts té una força simbòlica que cap argument legal aconsegueix neutralitzar del tot. Durant segles, el llibre ha estat un objecte cultural associat a la preservació, la transmissió i la permanència. En el Projecte Panamà apareix com un suport prescindible: es compra, es talla, s’escaneja i es recicla. El contingut es conserva com a dada; l’objecte desapareix. L’operació no pretenia cremar llibres ni esborrar coneixement, però sí revela una transformació profunda: per a l’economia de la IA, el llibre val menys com a obra que com a unitat d’entrenament.

La pregunta incòmoda és si aquest canvi degrada la cultura escrita o la insereix en una nova cadena de valor. Anthropic podria argumentar que el model no reprodueix els llibres, sinó que extreu patrons lingüístics, estructures narratives, estils, relacions semàntiques i coneixement general per generar respostes noves. Aquesta va ser, en bona mesura, la lògica acceptada pel jutge Alsup quan va considerar que l’entrenament era “transformatiu”. Reuters va resumir la decisió assenyalant que el tribunal entenia que Anthropic havia transformat de manera substancial els materials originals en utilitzar-los per desenvolupar Claude.

Els autors i editors, però, hi veuen una altra cosa: una indústria multimilionària que ha construït productes comercials gràcies a obres alienes, sense demanar permís ni pagar llicències prèvies. La compensació posterior, fins i tot quan arriba, no resol del tot el problema moral. Si una empresa tecnològica pot utilitzar milions de llibres per aixecar un model i discutir la legalitat només després, l’asimetria de poder és evident. Els creadors han de litigar contra gegants finançats amb capital massiu, mentre les seves obres ja han estat absorbides per sistemes que poden competir parcialment amb ells.

L’acord d’Anthropic és històric per la seva quantia. La xifra de 1.500 milions de dòlars representa una de les majors recuperacions conegudes en matèria de copyright i preveu pagaments d’uns 3.000 dòlars per títol elegible, segons AP i l’Authors Guild. Però també té límits: afecta un conjunt concret d’obres, no cobreix necessàriament usos futurs i no tanca el debat jurídic general sobre l’entrenament de models amb continguts protegits.

El que emergeix del cas Anthropic és una nova geografia del conflicte cultural. Abans, el copyright es discutia al voltant de còpies, vendes, descàrregues, biblioteques digitals o plataformes de distribució. Ara es discuteix sobre entrenament, vectors, pesos de models, datasets, inferències i sistemes capaços de produir textos derivats estadísticament d’una immensa exposició a obres humanes. La infracció ja no sempre adopta la forma clàssica d’una còpia visible. Pot residir en l’apropiació massiva d’un corpus per produir una capacitat comercial.

Aquest desplaçament complica la resposta legal. Si un model no retorna fragments substancials d’una novel·la, ha vulnerat el dret de l’autor? Si aprèn de milers de llibres de cuina i després genera receptes noves, competeix amb els autors originals? Si absorbeix estils periodístics, acadèmics o literaris, està simplement aprenent com un lector humà o explotant industrialment un patrimoni creatiu? La comparació entre IA i aprenentatge humà és seductora, però insuficient. Un lector no ingereix milions de llibres en setmanes ni converteix aquest aprenentatge en un producte venut globalment per una empresa valorada en milers de milions.

El Projecte Panamà també revela la fam material de dades de la IA. Durant anys es va parlar del núvol, els models i els algoritmes com si fossin entitats immaterials. Però entrenar IA requereix servidors, energia, xips, centres de dades, cables, aigua per a refrigeració i també llibres, imatges, vídeos, veus, articles, fòrums, manuals i arxius. La intel·ligència artificial no neix del no-res: es construeix sobre infraestructures físiques i sobre treball cultural acumulat. La destrucció de llibres de paper és només la imatge més visible d’una maquinària molt més àmplia.

L’operació d’Anthropic va tenir, a més, una lògica defensiva. En un entorn cada vegada més litigiós, comprar llibres físics podia servir per reforçar la posició legal de la companyia davant acusacions d’ús indegut d’obres. El raonament era senzill: si l’empresa adquiria exemplars al mercat, els escanejava internament i no distribuïa les còpies digitals, podia defensar que actuava dins dels marges de l’ús legítim. El jutge va acceptar parcialment aquesta tesi, encara que no va estendre el mateix emparament a les descàrregues pirates.

Però aquesta estratègia planteja una altra qüestió: comprar un llibre dona dret a convertir-lo en entrenament per a una IA comercial? En el món analògic, adquirir un exemplar permet llegir-lo, prestar-lo, revendre’l o conservar-lo, però no explotar l’obra en qualsevol format. La doctrina del “first sale” esgota certs drets sobre l’exemplar físic, no necessàriament sobre l’obra intel·lectual. El tribunal nord-americà ha considerat que, en aquest cas concret, l’ús transformatiu pesa molt. Però altres països, amb marcs legals diferents, podrien arribar a conclusions diferents.

La comparació amb Meta i altres tecnològiques mostra que Anthropic no és un cas aïllat. La cursa per aconseguir dades ha empès les grans companyies a explorar biblioteques, repositoris, arxius web i col·leccions de llibres amb una agressivitat que ara comença a conèixer-se gràcies a litigis i documents interns. La indústria de la IA generativa s’ha desenvolupat en una zona grisa: primer va entrenar, després va llançar productes, i finalment ha arribat la discussió legal. Aquest ordre temporal ha afavorit les empreses, no els creadors.

El cas també obliga a revisar la reputació ètica d’Anthropic. La companyia s’ha diferenciat d’altres actors pel seu discurs sobre seguretat, alineament i responsabilitat. Claude ha estat presentat com un model prudent, útil i menys propens a certs riscos. Però l’ètica d’una empresa d’IA no es pot limitar al comportament del model en la conversa amb l’usuari. També ha d’incloure la procedència de les dades, la relació amb els creadors, la transparència dels processos i la manera com es distribueix el valor econòmic generat.

La destrucció de milions de llibres no significa que Anthropic hagi volgut destruir la cultura. L’objectiu era exactament el contrari: capturar cultura escrita perquè Claude pogués produir llenguatge d’alta qualitat. Però aquí rau la contradicció: per construir una màquina capaç d’escriure, l’empresa va tractar els llibres com a matèria primera fungible. La cultura va ser preservada com a dada, no com a relació amb autors, editors, lectors i comunitats.

Aquest episodi marca un punt d’inflexió perquè fa visible el que normalment roman ocult. Cada resposta fluida d’un xatbot té darrere una cadena d’extracció: textos recollits, filtrats, netejats, tokenitzats, entrenats i convertits en capacitat estadística. L’usuari veu una interfície amable. Els tribunals comencen a mostrar la rerebotiga: biblioteques pirates, acords milionaris, llibres tallats, magatzems de dades i estratègies legals per justificar una captura massiva de coneixement.

La gran batalla que ve no serà només tecnològica, sinó contractual i política. Autors, editorials, mitjans de comunicació, universitats i arxius hauran de decidir si llicencien els seus continguts, sota quines condicions i amb quins mecanismes de traçabilitat. Les empreses d’IA hauran d’acceptar que l’opacitat ja no és sostenible. I els reguladors hauran de definir si l’entrenament de models pot continuar recolzant-se en interpretacions àmplies de l’ús legítim o si cal un sistema específic de remuneració, exclusió voluntària, registre i auditoria.

El Projecte Panamà deixa una lliçó clara: la IA generativa no només amenaça llocs de treball creatius pel que pot produir, sinó per la manera com ha estat construïda. La discussió sobre drets d’autor ja no es pot reduir a si Claude, ChatGPT o Gemini copien fragments literals. El problema és més profund: tota una indústria ha après a escriure gràcies a biblioteques humanes i ara ha d’explicar què deu als qui les van fer possibles.

La paradoxa final és poderosa. Perquè Claude aprengués a escriure, Anthropic va necessitar llibres. Molts llibres. Tants que va haver de comprar-los per milions, tallar-los i convertir-los en dades. Aquesta escena resumeix una època: la intel·ligència artificial es presenta com a futur, però s’alimenta del passat; promet creativitat automàtica, però depèn de la creativitat humana; parla amb una veu nova, però ha après llegint veus alienes. La qüestió ja no és si la IA pot escriure. La qüestió és qui ha pagat el preu perquè pogués fer-ho.

Leave a Reply