OpenAI treballa en un altaveu intel·ligent amb càmera i reconeixement facial que podria permetre compres, amb un preu estimat d’entre 200 i 300 dòlars.
OpenAI vol que ChatGPT deixi de ser “una app” i comenci a semblar una presència permanent a casa. Segons la informació avançada per The Information i recollida per Reuters, la companyia està desenvolupant el seu primer dispositiu de consum: un altaveu intel·ligent amb càmera, amb un preu orientatiu d’entre 200 i 300 dòlars, capaç d’interpretar el que passa al seu voltant —des d’“objectes en una taula propera” fins a “converses a les proximitats”— i amb un sistema de reconeixement facial estil Face ID pensat, entre altres coses, per habilitar compres.
La jugada marca un canvi d’etapa: si en els darrers anys OpenAI ha lluitat per ser el motor conversacional dominant, ara explora com es materialitza aquesta intel·ligència en maquinari i, sobretot, quina interfície la fa quotidiana. No és casual que el primer format sigui un altaveu. És el dispositiu que encaixa millor amb la idea d’“IA ambiental”: sempre disponible, mans lliures i situat al centre de la llar. El diferencial —i també el més sensible— és la càmera i el salt cap a la percepció de l’entorn.
El “ChatGPT de la llar” i el poder de veure
El concepte recorda els altaveus intel·ligents que ja han normalitzat Amazon i Google, però amb una ambició diferent: no només respondre preguntes, sinó comprendre el context físic. L’informe assenyala que el dispositiu podria reconèixer elements de l’entorn i converses properes per ajustar respostes, accions i suggeriments.
En teoria, això permet experiències més fluides: demanar que recordi quins medicaments hi ha sobre la taula, que identifiqui un producte per reposar-lo o que ajudi a organitzar tasques domèstiques a partir de senyals visuals. Però el mateix mecanisme obre una qüestió inevitable: què significa posar una càmera “per entendre’t” al saló? La indústria ja ha viscut aquesta fricció. Amazon, per exemple, va provar formats amb càmera (Echo Show, Ring) i va aprendre que l’usuari accepta millor la càmera quan entén clarament per a què serveix (videotrucades, seguretat) i quan percep controls físics i transparència.
OpenAI, a més, hi afegeix un element que eleva el risc reputacional: l’informe parla d’un sistema d’identificació facial que permetria comprar. En altres paraules, no seria un simple assistent, sinó una peça d’infraestructura per a transaccions. Això implica seguretat, compliment normatiu i confiança, però també una pregunta estratègica: vol OpenAI competir en pagaments, “commerce” i verificació d’identitat des de la llar?
El factor Jony Ive: el disseny com a avantatge… i com a missatge
Darrere del salt al maquinari hi ha l’aliança amb Jony Ive. OpenAI va anunciar el 2025 la seva relació amb Ive i l’equip d’io Products, amb integració de l’equip i responsabilitats de disseny i creativitat associades a LoveFrom. Aquell moviment es va interpretar com una manera d’adquirir quelcom escàs en el sector: llenguatge industrial, obsessió pels detalls de producte i capacitat per definir una categoria, no només un aparell.
El mercat de “gadgets d’IA” és ple d’advertiments recents: dispositius amb promeses grandiloqüents que han quedat atrapats entre limitacions tècniques, bateria, latència, connectivitat i expectatives irreals. Per això, començar amb un altaveu (endollat, connectat, domèstic) sona pragmàtic. Menys fricció energètica, menys dependència del mòbil, més marge per a sensors i computació local. També és el tipus de producte on el disseny pot fer que una càmera resulti “acceptable” o, al contrari, inquietant.
Calendari i maduresa: res abans del 2027
L’informe també refreda l’eufòria: el llançament no seria imminent. The Verge situa que no arribaria als clients abans del març del 2027, mentre que Reuters indica que no estaria disponible abans del febrer del 2027. Més enllà de la discrepància d’un mes, el missatge és clar: OpenAI es pren temps per industrialitzar, iterar prototips i construir una cadena de subministrament a escala.
A més, el mateix paquet de filtracions introdueix altres formats —ulleres i llum intel·ligent— però amb encara més incertesa. Les ulleres no entrarien en producció massiva fins al 2028 i la llum apareix com a prototip en fases primerenques, sense confirmació de llançament. Això suggereix que OpenAI està explorant diverses “carcasses” per a la IA, però que l’altaveu amb càmera és el candidat més realista per inaugurar la línia.
Una cursa més gran: Apple, Meta i el “post-smartphone”
OpenAI no es mou en buit. Meta ha trobat tracció amb les seves ulleres intel·ligents, i Apple —segons Bloomberg— accelera una tríada de wearables per a l’era de la IA: ulleres, un “pendant” tipus penjoll o pin i AirPods amb càmeres, tots al voltant d’un Siri que faci servir context visual. En paral·lel, la filtració d’OpenAI també esmenta ulleres i llum, com si el sector estigués convergint en una idea compartida: la IA necessita ulls, no només veu.
En aquest tauler, l’altaveu amb càmera pot ser una manera de guanyar terreny sense xocar frontalment amb l’iPhone o amb un ecosistema mòbil tancat. Però també planteja un dilema competitiu: Apple, Google i Amazon fa anys que integren assistents a la llar, i controlen sistemes operatius, botigues i serveis. OpenAI, en canvi, parteix de la seva fortalesa: el model i l’experiència conversacional. La pregunta és si aquest avantatge és suficient perquè l’usuari canviï de dispositiu, o si l’altaveu serà un “punt d’entrada” per a un ecosistema propi de serveis i subscripcions.
Privacitat i governança: el tema que decidirà el producte
Si hi ha un element que decidirà el destí del gadget, serà la gestió de la privacitat. Una càmera “ambiental” i un micròfon “sempre a punt” obliguen a controls contundents: obturador físic, indicadors d’enregistrament inequívocs, processament al dispositiu quan sigui possible, esborrats verificables, perfils per usuari i separació estricta entre funcions. La filtració parla de reconeixement facial per a compres; això requereix no només precisió, sinó garanties: es guarda l’“embedding” localment?, com s’evita la suplantació?, què passa amb convidats o menors?, es pot operar sense biometria?
No és un detall tècnic: és el nucli del contracte amb l’usuari. La indústria ja sap que, a la llar, la confiança pesa més que la novetat. OpenAI, a més, arrossega un escrutini estructural per ser el proveïdor d’un model generalista que s’integra en múltiples plataformes. Convertir-se també en fabricant de maquinari vol dir que la companyia passaria a gestionar dades sensorials de primer ordre.
Per què una llum?
Que aparegui una “smart lamp” com a prototip sona estrany, però encaixa amb una intuïció: la pròxima interfície de la IA potser no serà una pantalla, sinó un objecte quotidià amb una presència “calmada”. La llum permet quelcom que l’altaveu no: direcció i ambient. Pot orientar la llum cap on mires, assenyalar objectes, comunicar estats sense notificacions agressives i convertir-se en una “àncora” domèstica per a una IA que observa l’entorn. Però, precisament per ser tan domèstica, també exigeix una integració estètica impecable i un propòsit clar; d’aquí que l’informe insisteixi que la seva sortida és incerta.
El que realment hi ha en joc
Més que un altaveu, OpenAI està posant a prova una tesi: la IA com a plataforma d’interacció diària. Si l’empresa aconsegueix que ChatGPT sigui útil sense obrir el mòbil —i si ho fa sense trencar la confiança— haurà fet un pas cap al “post-smartphone”, aquella idea recurrent que la informàtica es dispersa en objectes. Si falla, s’afegirà a la llista de gadgets d’IA que no han sabut justificar la seva existència davant d’un telèfon que ja ho fa tot.
De moment, el verificable és això: hi ha un equip dedicat, un primer dispositiu plausible (altaveu amb càmera), un rang de preu pensat per a consum massiu i un calendari que apunta al 2027. La resta —ulleres i llum— sona a laboratori de formats. I aquesta fase, en tecnologia, sol ser la més reveladora: quan una companyia deixa de preguntar “què pot fer la IA” i comença a preguntar-se “on viu”.