L’auditoria automàtica, que consisteix a utilitzar agents generatius per provar altres IA, ja no és un experiment de laboratori. Anthropic, OpenAI, DeepMind i Microsoft integren proves contínues que busquen…
La Comissió Europea ha publicat les directrius que defineixen el risc sistèmic en models d’IA de propòsit general i fixen les obligacions tècniques i de transparència que la Llei…
Els models de llenguatge que “pensen en veu alta” deixen un rastre semàntic que els investigadors poden vigilar per detectar intencions danyoses, segons l’informe Chain of Thought Monitorability; sense…
La pràctica d’incrustar instruccions ocultes —o prompts invisibles— perquè els revisors que depenen de models d’IA qualifiquin “en positiu” s’expandeix. La tècnica consisteix a camuflar text…
Kalshi emet un anunci de 30 segons creat amb IA durant el Tercer Partit de les Finals de l’NBA, produït en només dos dies i amb un cost de 2.000…
La IA ofrece grandes oportunidades empresariales, pero su adopción enfrenta desafíos de integración, cultura y expectativas.
Disney i Universal acusen Midjourney de reproduir sense autorització personatges icònics com Darth Vader, Elsa i els Minions, en la primera gran demanda de Hollywood contra una empresa de…
Un estudi revela que la generació augmentada per recuperació (RAG) disminueix la fiabilitat de la IA
Un estudi presentat a NAACL 2025 revela que els models de llenguatge amb generació augmentada per recuperació (RAG) poden esdevenir menys segurs, fins i tot si tant el model com els documents…
Meta planeja reemplaçar fins al 90% de les seves revisions internes de privacitat, seguretat i integritat a Facebook, Instagram i WhatsApp amb intel·ligència artificial, segons documents interns obtinguts per NPR. Durant…
Cristina Mont reflexiona sobre los sesgos en IA que amplifican estereotipos sociales. ¿Cómo podemos detectarlos y corregirlos?