IA que se aprimora sozinha, Opus 4.8, novidades da Nvidia, modelos 3D prontos para jogos, robôs m...
IA revolucionária: Nvidia lança Opus 4.8, modelos 3D para jogos e robôs autônomos.
Conteudo
TLDR;
Opus 4.8 é o novo modelo da Anthropic capaz de reconstruir uma cena inteira a partir de um vídeo de celular casual. A Nvidia lançou várias ferramentas open-source, como o Locate Anything (detector visão-linguagem com decodificação de caixas em paralelo), o PID upscaler ultrarrápido e um simulador de mundos para múltiplos agentes, com código no GitHub para rodar localmente. Modelos como Triclat/Triplat geram cenas 3D em primitivas triangulares já prontas para simulação e interação física, e o Roblox também liberou um gerador open-source de assets prontos para jogos a partir de texto.
Resumo
A semana foi intensa no ecossistema de IA: a Anthropic lançou o Opus 4.8, capaz de reconstruir cenas inteiras a partir de um simples vídeo de celular; a Nvidia abriu vários projetos poderosos, como o LocateAnything, um modelo de grounding visão-linguagem que usa decodificação paralela de caixas para localizar e segmentar objetos em imagens e vídeos com rapidez e consistência geométrica (treinado com 103 milhões de consultas e centenas de milhões de caixas, disponível como modelo de ~3 bilhões de parâmetros e 7,8 GB); o ControlLight, ferramenta de edição e relighting que ajusta brilho e dureza da luz preservando detalhes e estrutura; o Triplat, que reconstrói cenas 3D “prontas para simulação” usando triângulos em vez de gaussian splats (modelos ~4,4 GB); e o PID, um upscaler por difusão de pixels que gera saídas em alta resolução diretamente no espaço de pixel (512→2K em menos de 1s), superando alternativas como o SDeVR2. Também surgiram geradores 3D open-source (incluindo da Roblox), sistemas agentivos para pesquisa científica, simuladores de mundo com múltiplos jogadores, geração de imagens em celular, relighting avançado e demos impressionantes de robôs humanoides — muitos recursos já liberados como código aberto. Os repositórios incluem instruções completas para baixar, treinar e executar localmente, democratizando o acesso globalmente.