El nou sistema de síntesi de veu d’ElevenLabs incorpora emocions, suport multilingüe i la capacitat de generar diàlegs
Amb el llançament del model Eleven v3, l’empresa nord-americana ElevenLabs ha decidit que les veus sintètiques ja no han de sonar sintètiques i avorrides. Ara són capaces de riure, emocionar-se, sospirar i fins i tot cantar. I, a més, ho poden fer en més de 70 idiomes. I sorpresa, un d’ells: el català. Amb etiquetes com [sospira] o [riu], la màquina incorpora aquests matisos i així les frases semblen molt més humanes. Ja no es tracta només de llegir un text, sinó d’interpretar-lo. La IA comença a fer teatre.
El català, amb veu pròpia
Encara que ElevenLabs ja oferia suport per al català en el seu sistema de transcripció (Scribe v1), on aconseguia una taxa d’error del 2,5% en el benchmark FLEURS, la novetat és la seva integració total en la generació de veu. Això permet usar el català en contextos on l’expressivitat vocal és clau, com audiollibres, pódcasts o assistents virtuals.
Segons la companyia, totes les veus poden ajustar-se per parlar en qualsevol dels idiomes suportats, cosa que inclou la creació d’escenes multilingües o emotives en català amb naturalitat.
Una infinitat de possibilitats noves
Amb aquest nou model és possible crear personatges en català —i 69 idiomes més— que parlin amb emoció. Podcasts, audiollibres, videojocs… Un univers que fins fa poc només parlava en anglès. I ara, amb una mica d’enginy i unes quantes etiquetes, pots fer que una veu digital llegeixi un poema de Salvador Espriu com si plogués a Sinera. És només una eina, sí. Però les eines, en mans creatives, canvien realitats.
Sense API, però amb descompte
La versió alpha està disponible via web amb un descompte del 80% fins a finals de juny. L’API encara no ha sortit, però tot arriba. Per ara, toca jugar. Provar. I veure fins on pot arribar una màquina quan aprèn no només a parlar, sinó a dir alguna cosa amb sentit.
Obre un parèntesi en les teves rutines. Subscriu-te al nostre butlletí i posa’t al dia en tecnologia, IA i mitjans de comunicació.