MiniMax M2.7 Built ITSELF! + Gemini's NEW Design AGENT & Claude's New Superpower!
MiniMax M2.7 que se constrói sozinho inaugura uma era de IA autônoma, enquanto a Gemini apresenta um Design Agent inovador e Claude revela um novo superpoder que promete transformar a criatividade digital.
Conteudo
TLDR;
O MiniMax M2.7 é um modelo de IA que usou uma versão anterior de si mesmo para construir seu próprio harness de reinforcement learning, atualizar memória, rodar avaliações, corrigir código e otimizar processos autonomamente, alcançando até 30% de melhoria em testes internos e excelentes benchmarks em engenharia de software. O novo agente de design do Gemini, chamado Vibe Design no Stitch, é um canvas AI nativo que cria interfaces a partir de descrições de vibe e objetivos, com suporte a múltiplos agentes, design.md portátil, protótipos interativos e comandos por voz. O novo superpoder do Claude é o Dispatch no Co-work, que permite enviar tarefas do celular para uma sessão persistente na nuvem rodando no desktop, acessando arquivos e ferramentas locais de forma segura em sandbox.
Resumo
A Miniax lançou o modelo M2.7, descrito como autoevolutivo, pois uma versão anterior ajudou a construí-lo, otimizando seu próprio aprendizado por reforço, corrigindo códigos, executando avaliações e ciclos iterativos que elevaram o desempenho em 30% em testes internos. Ele brilha em benchmarks de codificação, como 56,22% no Software Engineering Pro, 55,6% no Vipro e 57% no Terminal Bench 2, competindo com GPT e Claude Opus; em tarefas de escritório, alcança ELO 1495 no GDP Vala, manipulando Word, Excel e PowerPoint; e em competições de ML, 66,6% de taxa de medalha. Destaca-se por equipes de agentes treinadas nativamente para raciocínio colaborativo. Open-source do Open Room, um agente interativo em GUI, e disponível na plataforma e API da Miniax. O Google reformulou o Stitch como canvas de design AI nativo, chamado Vibe Design: descreva o "vibe", objetivos e sensações, e ele gera UIs interativas como no Figma, com gerenciador de agentes, design.md portátil, protótipos automáticos e voz. Suporte a SDK e integração com AI Studio. A Anthropic lançou o Dispatch no Claude Co-work: envie tarefas do celular para uma sessão persistente na nuvem que executa no desktop, acessando arquivos locais em sandbox seguro, como resumir propostas remotamente. (198 palavras)