A startup chinesa DeepSeek criou um assistente gratuito que pode marcar um ponto de virada global no nível de investimento necessário para o desenvolvimento de uma Inteligência Artificial. Com um novo modelo de mercado, lançado no último dia 10 de janeiro, a empresa usa menos dados e por um custo menor que os modelos mundialmente estabelecidos.
Os modelos de IA, do ChatGPT à DeepSeek, exigem chips avançados para alimentar seu treinamento. Desde 2021, o governo Biden ampliou o escopo de proibições destinadas a impedir que esses chips sejam exportados para a China e usados para treinar modelos de IA de empresas chinesas.
A IA criada na China é alimentada pelo modelo DeepSeek-V3, que, segundo seus criadores, “está no topo da tabela entre modelos de código aberto e rivaliza com os modelos de código fechado mais avançados do mundo”. O aplicativo de IA vem crescendo em popularidade entre os usuários dos EUA.
O crescimento da IA chinesa derruba visões amplamente difundidas sobre a primazia dos EUA em IA e a eficácia dos controles de exportação de Washington visando os recursos avançados de chip e IA da China.
DeepSeek: alta inovação tecnológica
A empresa adota estratégias de alta inovação tecnológica, como “Reinforcement Learning” (Aprendizado por Reforço): permite que os modelos aprendam por tentativa e erro; “Mixture-of-Experts Architecture (MoE)”: ativa apenas uma fração dos parâmetros do modelo para tarefas específicas, economizando recursos computacionais; “Multi-Head Latent Attention (MLA)”: melhora a capacidade dos modelos de processar dados e identificar padrões complexos.
A startup segue o modelo “open-weight”, parcialmente aberto, o que permite aos pesquisadores acessarem seus algoritmos. Isso democratiza o acesso à IA avançada e promove maior colaboração na comunidade global de pesquisa.
Especialistas acreditam que a startup pode provocar uma revolução no mercado de IA, levando empresas estabelecidas a reduzir custos e buscar inovações mais sustentáveis. “O sucesso do DeepSeek mostra que eficiência e inovação podem ser tão importantes quanto poder bruto”, disse François Chollet, pesquisador em Seattle, à Nature, ressaltando o impacto geopolítico da DeepSeek no papel estratégico da IA na competição entre China e EUA.
Desafios da IA chinesa DeepSeek
Pouco se sabe sobre a empresa por trás da DeepSeek, uma pequena startup sediada em Hangzhou e fundada em 2023, quando o Baidu, gigante dos mecanismos de busca, lançou o primeiro modelo chinês de linguagem de grande escala de IA.
Desde então, dezenas de empresas chinesas de tecnologia, grandes e pequenas, lançaram seus próprios modelos de IA, mas a DeepSeek é a primeira a ser elogiada pelo setor de tecnologia dos EUA por igualar ou até mesmo superar o desempenho dos modelos de ponta norte-americanos.
Apesar de sua ascensão meteórica, a DeepSeek enfrenta alguns desafios. Por exemplo, a empresa precisa construir uma reputação confiável fora da China para competir com gigantes como OpenAI e Google.
Outro exemplo: a censura. Seus modelos estão sujeitos a restrições governamentais que podem limitar sua adoção em mercados internacionais. Por último, as limitações de hardware: sem acesso irrestrito a chips avançados, a DeepSeek precisará continuar inovando para superar suas desvantagens computacionais.