DeepSeek: todas as chaves da bomba chinesa que tomba a ChatGPT, NVIDIA e as Big Tech norteamericanas

*Un artigo de Logo The Conversation

Hai dous anos que OpenAI conseguiu o “efecto Coca-Cola” co seu produto estrela, ChatGPT. Pero o novo bombazo, que neste caso máis ben sería o “efecto Bruce Lee”, dérono DeepSeek-R1 e Qwen 2.5, incriblemente baratos no seu desenvolvemento e de código aberto. Ambos, made in China.

Publicidade

A xente común, que non pertence á comunidade de expertos en IA –os de verdade, non os do hype–, apenas coñece a existencia doutras IA, e moito menos se son ou non libres, de código aberto. Hai tempo que existen alternativas a ChatGPT como Gemini, de Alphabet, que tamén é unha corporación privada norteamericana. E entre as IA de código aberto, a máis usada é LLaMA (Large Language Model Meta AI), que serviu de base ao desenvolvemento de ALIA, a IA española de código aberto que acaba de estrearse.

Con todo isto, China é hoxe a indiscutible protagonista tecnolóxica no mundo. Podería dicirse que puxo pé na lúa da carreira pola IA.

Publicidade

DeepSeek xa se pode usar

DeepSeek-R1, cunha interface gráfica moi similar a ChatGPT, xa se pode utilizar libremente desde a súa páxina web. Agora serán os usuarios quen decidan se quedar ou non, pero o seu atractivo parece irresistible: é gratis, e seguirá sendo gratis. ChatGPT non o é se se usa con todas as súas prestacións, e Gemini deixará de selo en canto pase o seu período de fidelidade.

Pero o máis esmagador da chegada de DeepSeek é que tombou a un xigante. A saída á rúa do modelo chinés ha provocado un esborralle do prezo do todopoderoso fabricante de chips NVIDIA de máis do 16 % no momento de escribir este artigo (cae en picado por minutos). NVIDIA perdeu 700 000 millóns de dólares en menos de 24 horas. Estamos diante da maior perda de capitalización bolsista da historia.

Por que os chineses abarataron tanto o prezo

Por que é tan barato DeepSeek? En primeiro lugar, os seus traballadores reduciron enormemente o custo de adestramento do modelo en relación co seu rendemento.

Segundo a propia DeepSeek, empregaron 5,57 millóns de dólares (5,33 millóns de euros). Para que se entendan estas cifras, este gasto supón menos dunha décima parte do gasto do modelo de pago da empresa ironicamente chamada OpenAI.

O adestramento, sempre segundo DeepSeek, durou 55 días, utilizando un conxunto de 2.048 unidades de procesadores gráficos H800 do fabricante de chips estadounidense NVIDIA, con 671 billóns de parámetros. Tamén hai versións destiladas máis pequenas. De feito estase replicando o adestramento completo de DeepSeek-R1 en Github, unha plataforma de desenvolvemento colaborador, o que confirma que estamos diante dunha IA aberta e libre.

Ademais, este modelo tamén é dez veces máis pequeno que os de OpenIA, o que lle fai moito máis rápido respondendo a prompts (instrucións). Pero a cousa non termina aquí.

En aberto

A empresa responsable de DeepSeek publicou o seu modelo con licenza MIT, é dicir, en aberto, e un artigo técnico detallando o completo funcionamento do modelo para que poida ser replicado. Todo un agasallo para a comunidade científica e unha bomba na liña de flotación das grandes corporacións ou Big Tech americanas e dos fabricantes de chips, que con excepción do modelo LLaMA de Meta, quedan un paso atrás. Viron como unha startup chinesa é capaz de publicar un modelo libre cuxo rendemento está á altura das súas máis sofisticados modelos de licenza propietaria.

Nesta imaxe, pertencente a un sistema de avaliación de modelos longos de linguaxe pública de HuggingFace, con boa reputación dentro da comunidade, pódese ver o fantástico rendemento de DeepSeek.

Exemplo do rendemento de DeepSeek. Foto: The Conversation
Exemplo do rendemento de DeepSeek. Foto: The Conversation

A resposta dos cidadáns

A reacción do público sobre o novo modelo longo de linguaxe de DeepSeek non se fixo esperar.

Na primeira semana de mandato de Donald Trump, xusto cando Sam Altman, CEO de OpenAI, subía un vídeo á rede social X dicindo que a sociedade debía repensar o contrato social actual para un futuro desenvolvemento das intelixencias artificiais, China asómase colapsando o mercado cunha soa mostra do gran desenvolvemento tecnolóxico que moitas veces occidente se obstina en ignorar.

Trump tamén anunciara o proxecto de IA Stargate, incorporando ás Big Tech nunha alianza sen precedentes, cun investimento de capital estatal de 500 000 millóns de dólares. E entón, unha startup chinesa é capaz de elaborar, e liberar, un modelo cunha fabulosa implantación e cunha idea técnica feliz, extremadamente eficiente.

Mesmo Yann LeCun, xefe de IA de Meta, felicitou ao equipo chinés por un logro que supuxo un auténtico terremoto para a comunidade mundial experta en intelixencia artificial.

Estamos diante dunha mostra de que as Big Tech e, en xeral, a industria tecnolóxica estadounidense quizais subestimaron ao xigante asiático.

As caídas en bolsa poden en parte ser explicadas pola fabulosa recepción do pobo norteamericano ao novo modelo longo de linguaxe. DeepSeek converteuse na aplicación máis descargada na App Store de Apple esta fin de semana en Estados Unidos, por diante de ChatGPT!

A innovación tecnolóxica despregada polo xigante asiático en multitude de campos está verdadeiramente á altura de Estados Unidos. Como exemplo diso pódese citar o prototipo EAST, que logrou manter un sol artificial de plasma de alto confinamento en estado estable durante 1 066 segundos, o que supón unha fito clave para conseguir enerxía de fusión, limpa e inesgotable.

No que a min respecta, como investigador, aseguro que xa sigo con moita atención ás empresas chinesas, debido a que o seu potencial innovador é indiscutible.


Cláusula de divulgación: Eduardo César Garrido Merchán non recibe salario, nin exerce labores de consultoría, nin posúe accións, nin recibe financiamento de ningunha compañía ou organización que poida obter beneficio deste artigo, e declarou carecer de vínculos relevantes máis aló do cargo académico citado.

Eduardo César Garrido Merchán
Eduardo César Garrido Merchán
Profesor colaborador asistente do Departamento de Métodos Cuantitativos na Universidade Potificia Comillas

DEIXAR UNHA RESPOSTA

Please enter your comment!
Please enter your name here

Este sitio usa Akismet para reducir o spam. Aprende como se procesan os datos dos teus comentarios.

Relacionadas

A IA de Google aprende galego: “É vital falalo para que a tecnoloxía non sexa unha barreira”

Gemini 3 integra o idioma por primeira vez, nunha actualización que reforza a comprensión multimodal á altura de competidores como ChatGPT e Copilot

Kiur, o software que combina IA e redes neuronais para apoiar aos sanitarios galegos

A ferramenta facilita a detección, análise e recomendación de tratamentos de feridas crónicas en persoas maiores, mellorando a eficiencia e a calidade asistencial

Leo, o neno que non pode falar nin moverse pero saca sobresaíntes grazas á tecnoloxía

O rapaz de 11 anos ten unha atrofia muscular espiñal e, ademais de non expresarse verbalmente, tan só ten mobilidade completa nas pupilas

O novo fito de De la Fuente: o deseño de antibióticos inéditos con IA

O equipo do bioenxeñeiro galego en Pensilvania crea un modelo de intelixencia artificial que xera moléculas antimicrobianas desde cero, con eficacia comparable a fármacos aprobados