Skip to main content

Gemma 3 ha rebut una actualització que millora la seva accessibilitat i optimització, la qual cosa permet als usuaris executar el model en els seus propis dispositius.

El mes passat, Google DeepMind va llançar Gemma 3, la seva última generació de models d’intel·ligència artificial oberts. Aquesta família es distingeix per poder funcionar en una sola GPU, la qual cosa va suposar un gran avanç en accessibilitat i eficiència. Ara, Google ha anunciat una versió encara més accessible, optimitzada amb entrenament conscient de quantització, conegut com a QAT (Quantization-Aware Training). Aquesta nova variant manté la mateixa qualitat que els seus predecessors, però consumeix menys recursos. Segons l’anunci oficial, aquesta millora permet «executar localment models potents com Gemma 3 27B en una GPU de consum com la NVIDIA RTX 3090».

QAT introdueix la quantització des de les primeres fases de l’entrenament, la qual cosa permet que el model s’adapti a operar amb menor precisió sense perdre rendiment. Per exemple, el model Gemma 3 27B, que abans necessitava 54 GB de VRAM en format BF16, ara pot funcionar amb només 14,1 GB en format int4. Així, els usuaris poden executar-lo localment amb una GPU com la NVIDIA RTX 3090. El model intermedi, Gemma 3 12B, ja es pot utilitzar eficientment en portàtils amb targetes gràfiques com la NVIDIA RTX 4060, la qual cosa facilita l’ús de models grans en equips portàtils. Finalment, el model més petit, Gemma 3 4B, funciona fins i tot en dispositius amb recursos limitats, inclosos telèfons mòbils.

Gemma 3 ja està disponible en plataformes com Hugging Face i Kaggle. També ofereix compatibilitat amb eines populars com Ollama, LM Studio, MLX, llama.cpp i gemma.cpp. Aquest ecosistema permet que desenvolupadors i entusiastes integrin fàcilment els models en els seus fluxos de treball sense necessitat de realitzar grans canvis.

Amb l’optimització del model Gemma 3, que permet executar-lo en l’entorn local, més que una millora tècnica és una declaració de principis. Democratitzar l’accés a la IA d’alt rendiment pot ser una de les claus per equilibrar el desenvolupament tecnològic en els pròxims anys.

Obre un parèntesi en les teves rutines. Subscriu-te al nostre butlletí i posa’t al dia en tecnologia, IA i mitjans de comunicació.

Gerard Quintana

Periodista. M'encanta el periodisme i la tecnologia.

Leave a Reply