Nova IA da China é 6 vezes mais eficiente que o Claude
Nova IA chinesa supera Claude em eficiência, alcançando 6 vezes mais desempenho.
Conteudo
TLDR;
A manchete refere‑se principalmente ao custo por token e à eficiência em tarefas de codificação — Kimi K 2.7 Code cobra $4 por milhão de tokens de saída versus $25 do Claude (mais de 6× mais barato) e GLM 5.2 cobra $4,40 (aproximadamente 6× mais barato), e em alguns benchmarks GLM 5.2 chega a superar o Claude, tornando a afirmação plausível nesse contexto. Os modelos são Kimi K 2.7 Code (Moonshot) — um MoE com 1 trilhão de parâmetros, 32 bilhões ativos, janela de contexto de 256k e otimizações para agentes de codificação — e GLM 5.2 (Z.ai) — um modelo de 753 bilhões com janela de até 1 milhão de tokens projetado para tarefas de longo horizonte. Em desempenho, GLM 5.2 supera ou empata GPT‑5.5 em vários testes de engenharia de software e fica próximo ao Claude em outros, enquanto ambos os modelos chineses oferecem custos por token cerca de 5–6 vezes menores que GPT‑5.5/Claude, trazendo muito maior custo‑benefício para workflows contínuos de coding.
Resumo
Após a controvérsia com o Fable 5, a resposta chinesa veio com dois modelos de código open‑weights competitivos: Kimi K 2.7 Code (Moonshot) e GLM 5.2 (Z.ai), que miram GPT‑5.5 e Claude oferecendo desempenho sério para agentes de programação a preços muito mais baixos. Kimi K 2.7 Code é um MoE de 1 trilhão de parâmetros com 32 bilhões ativos por token, janela de contexto de 256.000 tokens, suporte multimodal e um encoder de visão MoonViT; foca em fluxos de trabalho de agentes que navegam em bases de código, gasta ~30% menos tokens de “pensamento”, tem modos de raciocínio preservado/forçado e melhora significativamente benchmarks (ex.: Kimiko Bench V2 50.9 → 62.0; Program Bench 48.3 → 53.6), chegando a superar Claude em MCP Mark (81.1 vs 76.4); custa cerca de $0,95/mi tokens de entrada e $4/mi de saída e tem licença MIT modificada com requisitos de divulgação para grandes produtos. GLM 5.2 (753B) traz janela de 1 milhão de tokens, otimizações (index share, decoding especulativo) que reduzem flops e aceleram geração, modos selecionáveis de esforço e vence ou empata com GPT‑5.5 em vários testes (SWE‑Bench Pro 62.1 vs 58.6); preço aproximado $1,40/mi entrada e $4,40/mi saída, tornando‑o cerca de 1/6 do custo combinado do GPT‑5.5 em aplicações de codificação. No front paralelo, há rumores de aquisição da Cursor pela SpaceX por $60 bi e a OpenAI desenvolvendo o modelo de voz GPT‑BD1.