DeepSeek V4 DeepSpec Chegou & Um Novo Modelo da GLM Empata com o Mythos!
DeepSeek V4 DeepSpec chegou e um novo modelo da GLM empata com o Mythos!
Conteudo
TLDR;
DeepSeek lançou o DeepSpec/D‑Spark como um pacote totalmente open source (pesquisa, pesos, código de treino e scripts) sob MIT para acelerar e reproduzir seus métodos. A técnica usa um modelo rápido que rascunha tokens à frente com uma pequena cabeça que mantém atenção e um scheduler adaptativo, entregando entre 60% e 85% de aceleração por usuário em tráfego real mantendo saída praticamente idêntica. Relatos indicam que o novo GLM (esperado GLM‑5.5, com GLM‑5.2 já competitivo) alcança desempenho no nível do Claude/Mythos, sugerindo que modelos chineses podem em breve rivalizar os líderes./
Resumo
Recentemente a DeepSeek lançou o D‑Spark com paper e repositório completo sob licença MIT — checkpoints, código de treinamento e scripts de avaliação — demonstrando a tendência oposta às grandes labs fechadas que restringem acesso. O D‑Spark é um método de decodificação especulativa que acelera gerações usando um modelo pequeno para rascunhar tokens à frente e um modelo grande para checar; a novidade da DeepSeek foi anexar uma pequena cabeça ao modelo rápido para manter atenção entre tokens e um escalonador que ajusta até onde rascunhar conforme a carga, resultando em melhorias reais de 60–85% no tráfego ao vivo. Ao mesmo tempo, o ecossistema se divide: laboratórios fronteiriços fecham funcionalidades por controle de exportação e revisões de segurança, enquanto labs abertos publicam receitas completas (DeepSpec inclui várias abordagens para comparação). Na China, Zhipu.ai com GLM (5.2 e o esperado 5.5) avança: benchmarks mostram desempenho próximo a Claude/Meathos e uso massivo de chips locais acelera treinamento. Isso reduz a vantagem presumida dos modelos fechados e pode atrair desenvolvedores por confiabilidade e liberdade das soluções abertas. Muitos desenvolvedores preferem modelos abertos que não correm risco de serem retirados, e essa dinâmica pode redistribuir investimento para ecossistemas que publicam código e oferecem estabilidade.