DeepSeek V4 Benchmarks LEAKED + Claude Code Computer Use + OpenAI's Codex Plugin!
Nova versão do DeepSeek V4 surpreende com benchmarks incríveis e novas funcionalidades revolucionárias!
Conteudo
TLDR;
O título indica uma mistura de rumores e lançamentos importantes de IA, mas o conteúdo deixa claro que os benchmarks do DeepSeek V4 são vazamentos não verificados e que nada foi confirmado oficialmente.. O “Claude Code Computer Use” é um recurso em pesquisa que permite ao Claude controlar o desktop, abrir apps e testar interfaces, funcionando como último recurso quando MCP, shell ou navegador não atendem.. O plugin do Codex da OpenAI funciona dentro do Cloud Code, integrando o fluxo de desenvolvimento, mas o texto destaca que isso faz parte de um conjunto maior de novidades também envolvendo modo automático e melhorias de automação.
Resumo
O conteúdo reúne novidades importantes do universo de IA, começando por rumores sobre o DeepSeek V4, que teria benchmarks vazados apontando desempenho superior ao Claude Opus e ao GPT-5.3, com cerca de 200 bilhões de parâmetros na versão leve, janela de contexto de 1 milhão de tokens e suporte multimodal, embora tudo ainda seja não confirmado e sem validação oficial. Outro ponto é a suspeita de que o DeepSeek tenha trocado de modelo após uma queda de 7 horas, já que antes ele se identificava como versão 3 e depois passou a se comportar de forma diferente, inclusive com possível queda na qualidade de geração SVG. O texto também destaca lançamentos da Anthropic, como o recurso “computer use” no Claude Code, que permite ao modelo controlar a tela do computador e operar apps nativos quando não há APIs ou ferramentas mais precisas, sendo uma solução de último recurso com medidas de segurança e permissões específicas no Mac. Além disso, a empresa lançou o modo automático no Claude Code, expandindo o uso para empresas e API. Por fim, a OpenAI apareceu com um plugin do Codex que funciona diretamente dentro do Claude Code, enquanto a Microsoft também foi citada por avanços em pesquisa profunda multimodal.