El nomenament d’Alex Holt com a Field CTO confirma el gir estratègic d’ElevenLabs: la companyia ja no vol ser només una referència en generació de veu sintètica, sinó el soci tecnològic que ajuda governs i multinacionals a convertir els agents de veu en infraestructura crítica de negoci.
ElevenLabs acaba de fer un pas significatiu en la seva transició de startup de veu artificial a proveïdor global d’intel·ligència artificial per a grans empreses. La companyia ha anunciat el nomenament d’Alex Holt com a Field CTO, un càrrec des del qual assumirà la missió d’accelerar el treball amb clients corporatius, integrar-se directament amb els seus equips i ajudar-los a desplegar IA en productes i operacions crítiques.
La notícia, publicada per la mateixa ElevenLabs, té una lectura que va molt més enllà d’un simple moviment intern de lideratge. L’anunci confirma que l’empresa vol competir en la fase més exigent de la intel·ligència artificial generativa: no la de les demostracions espectaculars ni la de les veus hiperrealistes que sorprenen a les xarxes socials, sinó la dels desplegaments empresarials segurs, escalables, mesurables i connectats amb sistemes reals.
El càrrec de Field CTO té una càrrega estratègica molt concreta. No es tracta d’un director tecnològic tancat en un laboratori ni d’una figura purament comercial. És un perfil híbrid, situat entre la recerca, l’enginyeria, el producte, les vendes empresarials i el desplegament operatiu. La seva funció és estar a prop dels clients, entendre els seus sistemes, detectar els seus obstacles, traduir necessitats complexes en solucions tècniques i garantir que la IA no quedi atrapada en proves pilot sense impacte real.
Aquest és, precisament, un dels grans problemes actuals del sector. Moltes empreses han provat eines d’intel·ligència artificial el 2023, 2024 i 2025, però una part important d’aquestes iniciatives no ha arribat a producció. Els motius són coneguts: sistemes interns fragmentats, requisits de compliment normatiu, dubtes sobre privacitat, manca d’integració amb processos existents, dificultat per mesurar el retorn de la inversió, por a errors en interaccions amb clients i absència d’equips capaços de convertir models prometedors en productes fiables.
ElevenLabs vol situar-se exactament en aquest espai. La seva tesi és que la gran bretxa de la IA no es troba només en la qualitat dels models, sinó en la seva aplicació. La companyia ho formula amb claredat en el seu anunci: el repte consisteix a transformar models en productes fiables, segurs i escalables que generin impacte real per a clients d’arreu del món. Aquesta frase resumeix la nova etapa de la IA generativa. La pregunta ja no és únicament què pot crear una màquina, sinó com s’integra aquesta capacitat en una organització complexa sense trencar processos, reputació, seguretat o confiança.
Alex Holt encaixa en aquest relat perquè la seva trajectòria dins d’ElevenLabs s’ha construït al voltant del desplegament. Va ser un dels primers empleats de la companyia. Hi va entrar el 2023, quan l’equip tenia menys de deu persones, i ha participat en la construcció de productes, en l’escalat de la funció d’enginyeria desplegada sobre el terreny i en la cultura d’una empresa que ha crescut fins a superar les 500 persones, segons el mateix comunicat d’ElevenLabs. Aquest salt organitzatiu és extraordinari: en només tres anys, ElevenLabs ha passat de ser una promesa emergent en veu sintètica a una de les companyies europees d’IA més observades del mercat.
L’elecció de Holt també parla d’una cultura empresarial concreta. ElevenLabs destaca que representa algunes de les qualitats que l’empresa valora: córrer cap al foc, aspirar a l’excel·lència, pensar des dels primers principis i mantenir-se a prop de les persones i dels problemes per als quals es construeix la tecnologia. Darrere d’aquesta formulació corporativa hi ha una idea central: la IA empresarial no es guanya només amb recerca, sinó amb capacitat d’execució en entorns imperfectes.
L’anunci inclou un episodi revelador. ElevenLabs recorda el cas d’un client important a Califòrnia que necessitava suport per construir un projecte ambiciós d’agent de veu orientat al futur del videojoc. Holt es trobava a Àsia amb l’equip de recerca per mantenir estret el cicle entre investigació i desplegament, però va liderar durant les seves nits equips de producte, enginyeria, infraestructura i recerca per construir un dels desplegaments més grans d’agents conversacionals d’aquell moment. Després va volar a la costa oest dels Estats Units per treballar in situ amb el client i garantir que el desplegament escalés correctament.
Aquest cas il·lustra un dels canvis més rellevants del mercat de la IA. La frontera entre producte i servei s’està difuminant. Les empreses no compren simplement una API, un model o una llicència. Compren capacitat de transformació. Necessiten equips que entrin als seus sistemes, comprenguin els seus processos, connectin eines, adaptin models, resolguin incidències i assumeixin la tensió de portar la IA a producció. L’èxit ja no depèn només del rendiment d’un model en un benchmark, sinó de la qualitat de l’acompanyament tècnic.
Aquest enfocament recorda inevitablement Palantir, companyia en què Holt va treballar abans d’incorporar-se a ElevenLabs. Segons la mateixa empresa, Holt hi va ajudar a liderar desplegaments d’enginyeria d’alt risc amb el NHS durant la crisi de la Covid-19, donant suport a sistemes per a la distribució d’equips de protecció, el desplegament de vacunes i operacions sanitàries a escala nacional. Aquesta experiència és rellevant perquè Palantir va convertir l’enginyeria desplegada en una de les seves senyes d’identitat: equips tècnics que treballen colze a colze amb el client en contextos d’alta complexitat, amb dades sensibles i conseqüències reals.
ElevenLabs sembla adoptar una lògica semblant per a la IA de veu. En lloc de limitar-se a oferir eines de generació d’àudio, vol convertir-se en una empresa capaç d’acompanyar grans desplegaments. Aquest matís és decisiu. La veu és una interfície especialment delicada perquè es produeix en temps real, implica emocions, pot gestionar informació sensible i sovint substitueix o acompanya interaccions humanes en atenció al client, salut, administració pública, educació, entreteniment o serveis financers.
Un agent de veu no és un simple chatbot llegit en veu alta. Ha d’entendre els torns de paraula, detectar la intenció, respondre amb baixa latència, mantenir naturalitat, gestionar interrupcions, adaptar-se al to de l’usuari, complir regles, escalar a un humà quan sigui necessari i operar dins de límits clars. A més, ha d’integrar-se amb sistemes interns: CRM, bases de dades, plataformes de suport, sistemes d’autenticació, eines de facturació, historials de client o fluxos administratius.
Per això el nomenament d’un Field CTO té sentit. La veu artificial ha deixat de ser una tecnologia de contingut per convertir-se en una tecnologia d’operació.