DeepSeek desafia gigantes da IA com modelo económico

A semana começou movimentada no sector de Inteligência Artificial, com a ascensão da startup chinesa DeepSeek, fundada em 2024 por Liang Wenfeng.

A empresa ganhou destaque ao lançar o modelo de linguagem de código aberto chamado R1, que promete competir directamente com o ChatGPT da OpenAI. Especialistas estão a analisar o impacto do R1, e muitos acreditam que ele pode transformar, de forma significativa, o panorama actual da IA.

De acordo especialistas, o que torna o R1 da DeepSeek tão impressionante não são apenas as suas capacidades tecnológicas, mas também a forma inovadora e económica como foi desenvolvida.

Segundo relatos de engenheiros da empresa ao jornal norte-americano The New York Times, o modelo foi treinado utilizando apenas dois mil chips Nvidia, em comparação com os 10 mil usados pela OpenAI para treinar os seus modelos em 2023.

Além disso, o custo total para treinar o modelo R1 foi de apenas 6 milhões de dólares. Esse valor é significativamente inferior aos 65 biliões que a Meta anunciou como parte dos seus investimentos em IA. O modelo da DeepSeek também consome menos energia, o que representa uma abordagem mais sustentável e económica em relação aos gigantes da tecnologia dos Estados Unidos.

Jay Woods, estrategista-chefe global da Freedom Capital Markets, disse à Bloomberg que a eficiência económica e energética do R1 tem causado preocupação entre os investidores tecnológicos norte-americanos. A entrada em cena da DeepSeek também abalou Wall Street. Segundo o The Wall Street Journal, na segunda-feira, 27, as acções da Nvidia – maior fornecedora de chips para IA – sofreram uma desvalorização de 17%, resultando numa perda de capitalização de mercado de 589 biliões de dólares. No total, a DeepSeek contribuiu para uma redução de 1 trilião de dólares no valor das gigantes tecnológicas americanas.

O modelo R1 já conquistou milhões de usuários. Além de oferecer uma versão gratuita para navegadores, a DeepSeek disponibilizou um aplicativo que rapidamente alcançou o primeiro lugar em downloads na App Store, tanto nos Estados Unidos quanto na China.

No entanto, o rápido crescimento trouxe desafios para a startup. No seu site oficial, a empresa revelou que sofreu “ataques maliciosos em grande escala” devido à alta procura, forçando-os a limitar temporariamente novos registos.

Com um modelo de IA eficiente e acessível, a DeepSeek está atrair a atenção global e a redefinir padrões no sector de Inteligência Artificial. A startup não apenas apresentou uma alternativa viável aos modelos tradicionais, mas também despertou questionamentos sobre o domínio das empresas americanas no campo da IA, abrindo caminho para uma nova fase na competição tecnológica global.

Disputa entre Estados Unidos e China 

A plataforma de inteligência artificial chinesa DeepSeek iniciou um novo capítulo da disputa entre os Estados Unidos e a China pela liderança tecnológica, ao apresentar resultados que chocaram investidores mundo afora.

A startup chinesa tinha uma fracção do investimento mobilizado por “big techs”(gigantes de tecnologia), além de restrições impostas pelo Governo americano no acesso a chips de ponta da Nvidia, e, mesmo assim, desenvolveu um modelo de IA generativa tão eficiente quanto o ChatGPT, da OpenAI. Trata-se da DeepSeek-R1.

A reportagem mostra o que há de novo na DeepSeek e por que isso mudou quase tudo envolvendo a corrida pela liderança no desenvolvimento de IA.

O que é a Deepseek?

DeepSeek é uma plataforma de IA generativa chinesa, criada em 2023, com investimento do fundo High-Flyer. O fundador, Liang Wenfeng, fez fortuna usando inteligência artificial para tomar decisões de investimento no mercado financeiro.

Desde então, a DeepSeek investe em peso para atrair os maiores talentos da China com o objectivo de desenvolver o seu próprio modelo de IA. Em 2024, a empresa chinesa levou ao ar a primeira versão da sua plataforma, equipada com a DeepSeek-V2, actualizada depois para V2.5 e V3.

Foi o anúncio mais recente da startup, no dia 20 de Janeiro, o modelo DeepSeek-R1, que surpreendeu o mercado. Os criadores compararam o desempenho da sua criatura ao do o1, o modelo mais recente da OpenAI.

A DeepSeek está disponível na nuvem e também pode ser baixada para execução na própria máquina.

Quão boa é a Deepseek?

Em rankings de modelos de inteligência artificial, a DeepSeek disputa as primeiras filas com os GPTs da OpenAI e as variações do Gemini, do Google.

O modelo se destaca, sobretudo, nos testes de Matemática e Programação. Também fica à frente na escrita em chinês, embora seja capaz de se comunicar em inglês e português com fluência.

A imprensa internacional e o CEO da Meta, Mark Zuckerberg, ressalvaram que a IA não responde às perguntas sobre a situação política da China.

Programadores, por outro lado, que executam o modelo na própria máquina, mostram que a DeepSeek está livre de censura quando roda fora da nuvem.

Recursos utilizados

A DeepSeek tinha uma fracção do investimento mobilizado por big techs, além de restrições impostas pelo Governo americano no acesso a chips de ponta da Nvidia, durante o processo de desenvolvimento do R1.

Um artigo publicado pela equipa da DeepSeek em Janeiro menciona uso de placas H800 da Nvidia, fabricadas desde 2023, por um custo de menos de 6 milhões de dólares.

O megaprojecto de datacenters encampado por Sam Altman para desenvolver IA, por exemplo, prevê 100 biliões de dólares de investimentos iniciais.

Toda a mão de obra da DeepSeek é chinesa e foi formada na China, de acordo com o fundador, Liang Wenfeng.