Nova IA chinesa DeepSeek faz ações da Nvidia derreter nos EUA

As ações das grandes empresas de tecnologia dos Estados Unidos sofreram uma forte queda na segunda-feira (27), impulsionadas pelo lançamento do DeepSeek-R1, um modelo generativo de linguagem de grande escala (LLM) desenvolvido pela startup chinesa DeepSeek. O novo modelo surge como um concorrente direto ao ChatGPT, prometendo revolucionar o mercado de inteligência artificial com abordagens mais acessíveis e eficientes.
O impacto foi imediato: as ações de gigantes como Nvidia e Microsoft registraram quedas expressivas, enquanto o índice Nasdaq recuou mais de 3% em um único dia. A reação do mercado reflete a preocupação com a ascensão da DeepSeek, que está desafiando as lideranças do setor ao oferecer soluções de IA com custos significativamente menores e maior eficiência.
De acordo com a empresa chinesa, o DeepSeek-R1 utiliza menos dados e custa uma fração do valor necessário para treinar modelos concorrentes, como os da OpenAI. Isso pode representar um ponto de virada no setor, reduzindo drasticamente o nível de investimento necessário para o desenvolvimento de IA.
A Nvidia, líder global em semicondutores, foi uma das mais afetadas. Suas ações caíram 17% em um único dia, resultando em uma perda de aproximadamente US$ 600 bilhões em valor de mercado — a maior queda já registrada pela empresa em sua história. O motivo? Até então, acreditava-se que o treinamento de modelos de IA exigiria um poder de processamento cada vez maior, o que impulsionou a demanda pelos chips da Nvidia nos últimos anos. No entanto, o DeepSeek-R1 demonstrou que é possível alcançar resultados avançados com menos recursos, gerando incertezas sobre a futura demanda por chips da Nvidia.
O treinamento de modelos de IA é tradicionalmente a etapa mais cara e complexa do processo. A expectativa era de que, à medida que os modelos se tornassem maiores e mais sofisticados, a necessidade por chips aumentaria exponencialmente. Contudo, a DeepSeek teria quebrado esse paradigma ao treinar um de seus modelos mais recentes por apenas US5,6 milhões em cerca de dois meses. Em comparação, a empresa americana Anthropic revelou ter investido entre US$ 100 milhões e US$ 1 bilhão para treinar seus modelos.
O DeepSeek-R1 é um modelo de código aberto e totalmente gratuito, com capacidade de raciocínio comparável ao OpenAI o1, atualmente o segundo modelo mais poderoso da OpenAI. A DeepSeek introduziu técnicas inovadoras para otimizar o treinamento de IA, o que pode levar ao desenvolvimento de modelos ainda mais avançados no futuro.
Apesar de ser de código aberto, o DeepSeek-R1 não é acessível para o usuário comum. Para rodar o modelo, são necessários 671 GB de memória de placa de vídeo, o que o torna inviável para a maioria dos consumidores. No entanto, empresas com grande capacidade de processamento — como data centers equipados com GPUs de alta performance — poderão utilizá-lo para desenvolver produtos e serviços inovadores.
Como de costume, foram realizados testes para avaliar a imparcialidade e a liberdade nas respostas fornecidas aos usuários. Nesse aspecto, o novo modelo apresenta limitações quando o tema envolve o regime chinês.
Em resumo, o lançamento do DeepSeek-R1 não apenas abalou o mercado financeiro, mas também sinalizou uma mudança significativa no cenário da inteligência artificial, com potencial para democratizar o acesso a tecnologias avançadas e reduzir os custos associados ao desenvolvimento de IA.