Skip to main content

Gemini llança Storybook, una funció que converteix qualsevol idea en un conte il·lustrat de deu pàgines. Text, imatges i narració a l’instant. El que abans s’escrivia a mà ara es construeix en segons.

Quan la imaginació pren dreceres

Un drac amb insomni. Una sirena que tem l’aigua. Un robot que vol adoptar un gat. N’hi ha prou amb escriure una frase així i Gemini fa la resta. Des d’aquesta setmana, la seva nova funció Storybook permet generar contes infantils il·lustrats, amb veu narrada i estil visual a escollir. Tot en qüestió de segons. Tot des d’una conversa amb la IA.

Disponible en català i més de 45 idiomes, Storybook també permet pujar imatges pròpies —dibuixos, fotos, gargots— per integrar-les com a inspiració visual. El resultat és un conte breu, narrat, amb estètica de llibre real. Un que es pot imprimir, compartir o simplement guardar per abans de dormir.

Com es construeix un relat automàtic

La mecànica és simple. L’usuari escriu un prompt (“una formiga que vol arribar a la lluna”) i el sistema genera una història en deu escenes. Cada pàgina inclou un paràgraf i una imatge generada per IA. L’estil visual pot adaptar-se: des de còmic fins a plastilina, passant per versions en blanc i negre per acolorir.

La veu també és personalitzable. Es pot escollir entre tons aguts o greus, segons l’efecte desitjat. Tot ocorre dins de l’app de Gemini, el conte es construeix allà mateix, sense passos intermedis ni necessitat d’apps externes.

Per jugar, per aprendre o per recordar?

Google presenta Storybook com una eina per fomentar la creativitat familiar. Pot servir per inventar històries amb nens, repassar conceptes escolars o fins i tot convertir records personals en relats visuals.

Hi ha qui ho veu com un recurs pedagògic. Hi ha qui ho prova per explicar la història d’una mascota difunta. Hi ha qui simplement explora què pot fer una màquina amb una idea mínima. Cadascú decideix quin tipus de conte vol que li expliquin.

Dades que entren, continguts que no surten (per ara)

Segons Google, els continguts generats no s’emmagatzemen ni s’utilitzen per entrenar altres models. Les imatges pujades es processen localment i no queden guardades. La funció està etiquetada com a “experimental” i, per ara, la narració en veu no està disponible en tots els idiomes.

Els llibres es poden descarregar com a PDF o compartir mitjançant enllaç. També es poden imprimir directament des del navegador.

Petits errors en mons perfectes

En les primeres proves, diversos usuaris van detectar personatges que canvien d’aspecte entre pàgines, il·lustracions que no reflecteixen bé el text, peixos amb cames o fons que es repeteixen. Res greu, però suficient per recordar que la IA improvisa, no il·lustra.

L’experiència és sorprenent, però no sempre coherent. En la nostra prova, on li vam demanar que ens fes un conte sobre Paréntesis Media, va canviar el cabell de la protagonista de blanc a marró en algunes pàgines. És un bon primer pas, encara que lluny del control narratiu d’un autor humà.

Primera pàgina conte Paréntesis Media

Entre la veu sintètica i el record

La funció ja està activa per a tots els usuaris de Gemini, en mòbil i escriptori. N’hi ha prou amb obrir el xat, escriure una idea i deixar que la màquina l’expliqui. A la seva manera. Amb la seva veu.

Potser això és el més revelador: escoltar una història que sembla nostra, però que no hem escrit nosaltres.

Obre un parèntesi en les teves rutines. Subscriu-te al nostre butlletí i posa’t al dia en tecnologia, IA i mitjans de comunicació.

Leave a Reply