Skip to main content

L’estudi va seguir durant 30 mesos 26.811 estudiants xinesos i va detectar una paradoxa inquietant: els xatbots milloren les notes dels deures, però deterioren l’aprenentatge real quan l’alumne s’ha d’examinar sense ajuda.

La intel·ligència artificial generativa ha entrat a les aules per la porta més silenciosa i més difícil de controlar: els deures. No ho ha fet necessàriament a través de grans plans institucionals, plataformes educatives certificades o programes pedagògics dissenyats per experts, sinó mitjançant l’ús quotidià de xatbots per part d’estudiants que busquen resoldre abans, millor i amb menys esforç les tasques que se’ls encarreguen a casa. La promesa sembla impecable: més productivitat, més eficiència, més suport personalitzat i menys temps perdut. Però una nova investigació acadèmica obliga a mirar aquesta promesa amb molta més cautela.

L’estudi The Generative AI Learning Penalty: Evidence from Chinese Secondary Education, publicat com a document de treball del CEPR per David Strömberg, Victor Lei i Yanhui Wu, analitza un dels conjunts de dades més sòlids coneguts fins ara sobre l’impacte real de la IA generativa en l’aprenentatge escolar. La investigació va seguir durant 30 mesos 26.811 estudiants xinesos de secundària, dels cursos equivalents a l’ESO i al batxillerat, i va creuar l’ús de xatbots amb resultats en deures, temps d’execució, exàmens mensuals a porta tancada i proves d’accés d’alta exigència.

La conclusió és tan potent com incòmoda: la IA generativa millora de manera notable la productivitat aparent de l’alumne, però pot perjudicar el seu aprenentatge real. Segons l’estudi, quan els estudiants comencen a utilitzar xatbots per fer els deures, les qualificacions d’aquestes tasques augmenten aproximadament un 18%, mentre que el temps necessari per completar-les disminueix al voltant d’un 30%. A primera vista, el resultat sembla extraordinari. Més nota, menys temps, més eficiència. En qualsevol presentació corporativa, aquests indicadors serien celebrats com un èxit rotund.

El problema apareix quan l’estudiant ha de demostrar allò que ha après sense l’ajuda de la màquina. En els exàmens mensuals a porta tancada, sense IA i sense possibilitat de delegar la resposta en un xatbot, les notes cauen aproximadament un 20% durant els primers sis mesos. En les proves d’accés de més exigència, la penalització se situa entre el 18% i el 24%. L’estudi afegeix una altra dada especialment rellevant: el deteriorament no es manifesta completament de manera immediata, sinó que triga prop de dos anys a fer-se plenament visible. La IA no provoca només un sotrac puntual; pot generar una pèrdua acumulativa d’aprenentatge.

La paradoxa educativa és evident. Els deures, que tradicionalment servien per practicar, consolidar coneixements i preparar exàmens, es converteixen en una mètrica enganyosa quan la IA permet lliurar respostes correctes sense haver recorregut el procés mental necessari per obtenir-les. L’alumne sembla avançar, però en realitat pot estar substituint aprenentatge per resultat. El sistema veu una millora en la superfície, mentre el coneixement es buida per sota.

La investigació no sosté que qualsevol ús de la IA sigui perjudicial. La seva tesi és més precisa i, precisament per això, més important. La diferència decisiva és entre utilitzar la IA com a bastida d’aprenentatge o utilitzar-la com a substitut. Quan el xatbot actua com a tutor, guia, interlocutor o eina de suport, l’impacte negatiu es redueix. Quan s’utilitza per externalitzar el pensament, la pèrdua d’aprenentatge es dispara. En termes educatius, no és el mateix rebre ajuda per comprendre un problema que lliurar a la màquina la responsabilitat de resoldre’l.

El mecanisme detectat pels investigadors és molt clar. Al voltant del 80% dels usuaris d’IA mostren un patró reconeixible: temps d’execució anormalment curts i notes de deures anormalment altes. És a dir, no semblen estar utilitzant l’eina per estudiar millor, sinó per completar tasques més ràpidament i amb millors resultats formals. Aquest patró encaixa amb allò que la literatura denomina cognitive offloading, o externalització cognitiva: descarregar en una eina externa una part de l’esforç mental que hauria de fer l’estudiant.

La qüestió no és nova. Els alumnes han copiat deures molt abans de ChatGPT, DeepSeek o qualsevol altre xatbot. Han demanat respostes a companys, han utilitzat solucionaris, han buscat a internet i han recorregut a dreceres de tota mena. La diferència és l’escala, la qualitat i la invisibilitat de la nova drecera. Un xatbot no només dona una resposta: pot adaptar-la al nivell de l’estudiant, reformular-la, justificar-la, fer-la semblar pròpia i produir-la en segons. La còpia deixa de semblar còpia. La drecera deixa de semblar drecera. I el professor pot rebre una tasca correcta sense tenir garanties que darrere hi hagi hagut comprensió.

Aquest descobriment té una conseqüència directa per a l’avaluació escolar. Si els deures compten com a prova d’aprenentatge, la IA generativa desestabilitza aquesta relació. La tasca lliurada ja no es pot interpretar automàticament com a evidència de domini. Pot ser una prova de capacitat, però també pot ser una prova de delegació. En aquest context, els exàmens presencials, orals, pràctics o a porta tancada recuperen valor no per nostàlgia disciplinària, sinó perquè permeten observar què queda quan desapareix l’assistència automatitzada.

L’estudi també mostra que l’impacte no és uniforme. Les pèrdues són més grans en ciències socials que en disciplines STEM, afecten més els estudiants més joves i colpegen amb especial força els alumnes d’alt rendiment. Aquesta última dada resulta especialment cridanera. Es podria pensar que els millors estudiants estan més preparats per utilitzar la IA de manera intel·ligent. Tanmateix, la investigació suggereix que també poden tenir més incentius per optimitzar el resultat visible, reduir temps i mantenir qualificacions elevades en els deures sense pagar el cost immediat d’aquesta delegació.

Aquest detall obre una reflexió incòmoda sobre la cultura del rendiment. Quan el sistema premia el lliurament, la nota i la rapidesa, l’estudiant aprèn a maximitzar aquestes variables. La IA generativa encaixa perfectament en aquesta lògica. Permet produir respostes acceptables en menys temps. Redueix la fricció. Augmenta l’eficiència aparent. Però aprendre no sempre és eficient. Aprendre exigeix equivocar-se, provar, encallar-se, tornar enrere, reformular, memoritzar, comparar, escriure malament abans d’escriure bé i raonar abans de respondre. La IA pot ajudar en aquest procés, però també pot eliminar precisament les dificultats que fan possible l’aprenentatge.

La diferència entre scaffolding i offloading és, per tant, la clau del debat. La bastida educativa sosté l’alumne mentre aprèn a fer alguna cosa per si mateix. L’externalització cognitiva, en canvi, substitueix l’esforç de l’alumne per l’execució de la màquina. En el primer cas, la IA pot ser una aliada pedagògica. En el segon, es converteix en una pròtesi que millora el rendiment immediat mentre debilita l’autonomia intel·lectual.

El problema sistèmic és que el camí de menor resistència acostuma a imposar-se. No es pot esperar que un adolescent de 13, 14 o 15 anys esculli voluntàriament l’opció més lenta i exigent quan l’opció ràpida li ofereix millors notes visibles. La responsabilitat, per tant, no pot recaure només en l’alumne. L’escola, les famílies, les administracions i les plataformes tecnològiques han de redissenyar normes, tasques i sistemes d’avaluació perquè l’ús de la IA no premiï la substitució del pensament.

La investigació xinesa és especialment rellevant perquè observa el comportament real d’estudiants durant un període prolongat, no només una prova de laboratori o una enquesta de percepció. Aquí rau bona part del seu valor. Moltes discussions sobre IA educativa es basen en expectatives, discursos promocionals o pors abstractes. Aquest estudi introdueix dades de panell, seguiment longitudinal i comparació entre productivitat en tasques i rendiment en exàmens. No pregunta únicament si la IA agrada o si els alumnes creuen que aprenen més. Observa què passa quan l’eina entra en la rutina escolar.

El debat no hauria de desembocar en una conclusió simplista contra la IA. Prohibir-la de manera absoluta seria poc realista i probablement inútil. Els estudiants ja tenen accés a aquestes eines fora de l’aula, als seus telèfons, ordinadors i llars. La pregunta rellevant no és si la IA ha d’existir a l’educació, sinó sota quines condicions pot contribuir a l’aprenentatge sense reemplaçar-lo.

La gran pregunta de fons és què volem mesurar. Si el sistema mesura productes acabats, la IA serà un avantatge competitiu. Si mesura aprenentatge, comprensió i autonomia, caldrà dissenyar proves que obliguin l’estudiant a ser-hi intel·lectualment present. L’escola no pot competir amb la IA en velocitat de resposta, però sí que pot ensenyar allò que la IA no garanteix: criteri, memòria operativa, comprensió profunda, expressió pròpia, pensament crític i responsabilitat sobre el propi aprenentatge.

L’estudi The Generative AI Learning Penalty no tanca el debat, però el desplaça. Ja no n’hi ha prou de preguntar si la IA millora la productivitat escolar. La productivitat pot millorar mentre l’aprenentatge empitjora. Tampoc n’hi ha prou de celebrar que els estudiants lliurin millors deures. La nota d’un deure pot convertir-se en un indicador contaminat quan la tasca es realitza en un entorn no supervisat i amb eines capaces de resoldre-la gairebé completament.

La conclusió més raonable no és expulsar la IA de l’escola, sinó domesticar-la pedagògicament. Utilitzar-la després de l’esforç inicial, no abans. Exigir explicació, no només resultat. Valorar processos, no només lliuraments. Dissenyar eines que ensenyin, no que substitueixin. I recordar que, en educació, la drecera més brillant pot ser també el camí més ràpid cap a una pèrdua silenciosa d’aprenentatge.

Leave a Reply