9:19
youtube.com 03/05/2026 SRT AI Coder TODAY

A nova IA da NVIDIA transforma uma foto em um mundo que nunca se quebra.

IA da NVIDIA cria mundos indestrutíveis a partir de fotos.

Tecnologia nvidia AI 3D

Conteudo

TLDR;

Transforma uma única foto em um mundo 3D explorável (estilo jogo) usando um gerador baseado em diffusion transformer, referenciado como Lyra 2.0. Ela evita que o mundo “quebre” ao armazenar uma memória 3D por quadro — mapas de profundidade, nuvens de pontos reduzidas e informações de câmera por cada vista — e reutilizar as melhores vistas anteriores para recompor a cena consistentemente. As limitações incluem funcionamento apenas em cenas estáticas, herança de inconsistências fotométricas do conjunto de treino e possíveis artefatos ou “floaters” na geometria, embora modelo e código tenham sido liberados gratuitamente.

Resumo

Neste vídeo, o apresentador descreve avanços impressionantes em geração de mundos 3D a partir de uma única foto—exemplos como Lyra 2.0, Cosmos e Genie 3—capazes de transformar imagens ou Street View em ambientes exploráveis e úteis para simulações, jogos e treinamento de robôs e carros autônomos. Ele celebra a coerência multi-minuto alcançada recentemente, mas ressalta limitações anteriores como falta de permanência de objetos e inconsistências de memória. A solução explicada combina um gerador de difusão transformer com um cache tridimensional por quadro: em vez de fundir tudo num único modelo global, o sistema guarda pequenas “fotos” 3D (mapas de profundidade, nuvens de pontos reduzidas e informações de câmera) para cada vista e escolhe quais vistas anteriores melhor descrevem uma região ao retornar, evitando acumulação de erros. Estudos ablatórios demonstram que essa abordagem melhora consistência de estilo e controle de câmera, embora ainda enfrente limitações notáveis: funciona apenas com cenas estáticas, pode herdar problemas do conjunto de treinamento (variações de iluminação/exposição) e produzir artefatos geométricos devido a pequenas inconsistências entre vistas. Apesar disso, o código e modelos gratuitos representam um avanço promissor. O futuro provavelmente verá melhorias rápidas que solucionarão essas limitações e ampliarão aplicações práticas e criativas em curto prazo.