DeepSeek llança un model «intermig» amb ambicions de pròxima generació

La startup xinesa DeepSeek, amb seu a Hangzhou, ha fet un nou pas en la seva carrera per liderar el desenvolupament de models de llenguatge en presentar la seva nova versió experimental: DeepSeek-V3.2-Exp. Aquesta iteració, qualificada per l’empresa com una «etapa intermèdia» cap a la seva arquitectura de pròxima generació, incorpora millores clau que apunten a reduir els costos computacionals i augmentar l’eficiència, especialment en el processament de seqüències de text llargues.

A través d’una publicació a la plataforma Hugging Face, DeepSeek va destacar la introducció d’una tècnica anomenada Sparse Attention, que busca optimitzar l’ús de recursos en disminuir la densitat dels càlculs requerits sense sacrificar precisió en les tasques del model. Aquesta innovació, segons l’empresa, permet una execució més econòmica i, en alguns casos, un rendiment superior enfront de les seves versions anteriors.

El llançament ocorre després de l’impacte generat per models previs com DeepSeek V3 i R1, que van sorprendre l’ecosistema tecnològic més enllà de la Xina, inclosa Silicon Valley. Aquells models van demostrar que una startup asiàtica podia competir directament amb gegants com OpenAI i Anthropic, sovint amb pressupostos molt més ajustats. Encara que aquesta nova versió no pretén revolucionar el mercat com ho van fer els seus predecessors, sí que reforça l’estratègia de DeepSeek de mantenir-se a l’avantguarda tecnològica mentre redueix barreres d’entrada mitjançant preus més baixos: l’empresa va anunciar a X (abans Twitter) una reducció de més del 50% en els seus preus d’API.

Aquest moviment també sembla ser dirigit a tensar la competència dins de l’ecosistema xinès d’IA, on altres actors rellevants com Alibaba i el seu model Qwen busquen consolidar la seva posició. En cas de replicar l’èxit de V3 i R1, DeepSeek podria consolidar la seva presència internacional i accelerar l’adopció de la seva infraestructura per part de desenvolupadors externs.

El ritme d’innovació a DeepSeek reflecteix una estratègia d’iteració ràpida, amb llançaments consecutius que proven noves capacitats abans de consolidar-les en una arquitectura més robusta. La companyia encara no ha detallat quan arribarà aquesta «pròxima generació», però amb el desplegament de V3.2-Exp, prepara el terreny tècnic i comercial per a un llançament més ambiciós el 2026.

En un context geopolític on la intel·ligència artificial és tant una eina d’innovació com un actiu estratègic, el progrés de DeepSeek reforça el posicionament de la Xina com a potència tecnològica. Si aconsegueix mantenir el seu avantatge en costos i rendiment, podria no només influir en el mercat de LLMs, sinó també reconfigurar les dinàmiques de poder entre desenvolupadors d’IA a escala global.

Obre un parèntesi en les teves rutines. Subscriu-te al nostre butlletí i posa’t al dia en tecnologia, IA i mitjans de comunicació.

Tags:

DeepSeek llança un model «intermig» amb ambicions de pròxima generació

Tags:

Paréntesis MEDia

Previous PostPodria els EUA perdre la cursa de la IA davant de la Xina?

Next PostQuè tant pot “treballar” un model d'IA? El cas de GDPval

Leave a Reply

Qui som

Política de Privadesa

(TikTok)

(YouTube)

(Linkedin)

(Instagram)

(X)