O novo avanço em IA da China que não precisa da Nvidia
China desenvolve avanço em IA que não depende da Nvidia, revolucionando o setor.
Conteudo
TLDR;
A DeepSeek adaptou o V4 para rodar em chips da Huawei e redesenhou a arquitetura com atenção híbrida e compressão para reduzir FLOPs e uso de cache, permitindo modelos grandes sem os GPUs topo de linha da Nvidia. Os chips da Huawei ainda não superam os melhores da Nvidia (por exemplo o H200), embora possam vencer variantes mais antigas como o H20, e a estratégia é compensar a diferença via software e design de modelo. O V4 traz janela de contexto de 1 milhão de tokens, duas variantes (Pro e Flash) que ativam apenas parte dos parâmetros e técnicas que tornam viável e barato executar tarefas longas e agentes de IA com hardware doméstico.
Resumo
DeepSeek V4 representa um marco prático e geopolítico: a empresa lançou duas variantes — V4 Pro (1,6 trilhão de parâmetros totais, 49 bilhões ativados) e V4 Flash (284 bilhões totais, 13 bilhões ativados) — ambas com janela de contexto de um milhão de tokens, pensadas para tarefas longas e agentes que planejam, buscam, codificam e revisam. Reuters reportou que o preview foi adaptado para tecnologia de chips da Huawei e que esses chips participaram do treinamento, sinalizando uma ruptura com a dependência de GPUs Nvidia. Mesmo que Ascend 950 PR ainda fique atrás do topo Nvidia H200, a estratégia chinesa parece menos sobre igualar chip por chip e mais sobre projetar modelos e software que exigem menos poder e usam atenção híbrida — atenção esparsa comprimida e atenção fortemente comprimida — para reduzir FLOPs e cache KV, tornando memória extensa mais barata. Assim, China pode reduzir vulnerabilidade a controles de exportação: um ecossistema otimizado em torno de hardware local pode neutralizar a vantagem bruta da Nvidia, transformando a corrida por IA numa disputa de controle, compatibilidade e autonomia tecnológica. O lançamento também diferencia mercados: V4 Pro para tarefas complexas e V4 Flash para uso rápido, barato e em larga escala global.