47:06
youtube.com ha 6 dias SRT AI Coder TODAY

IA co-cientista, IA para DNA, NPCs com IA, robôs open-source, nova Qwen, novos editores de vídeo:...

Tecnologias revolucionárias: IA co-cientista, DNA, NPCs inteligentes e robôs open-source estão mudando o jogo!

Tecnologia IA Genômica

Conteudo

TLDR;

O novo Qwen da Alibaba é um modelo multimodal poderoso lançado recentemente que permite controlar vídeos com precisão usando referências. O projeto Reactive GWM cria mundos de jogo gerados por vídeo e permite guiar NPCs por estratégias de alto nível (por exemplo ofensiva ou defensiva) injetadas via cross‑attention, separando as ações do jogador das táticas do adversário. Foi divulgado um pequeno modelo open‑source para gerar e editar DNA, capaz de manipular sequências genéticas de forma automatizada conforme descrito no conteúdo.

Resumo

Na última semana o avanço em IA foi frenético: surgiram vários projetos open-source capazes de gerar e editar imagens e vídeos, criar jogos interativos com NPCs controláveis por prompts, um gerador de imagens que opera em espaço de pixels chegando a 8K, o robusto modelo Quen da Alibaba, ferramentas que controlam vídeos com referências, um modelo pequeno para gerar/editar DNA, sistemas que convertem plantas baixas em ambientes 3D consistentes, um realista gerador de avatares, um transcritor superior para áudio “bagunçado” e até um robô humanoide DIY. Destaques técnicos incluem Lance (ByteDance), um modelo multimodal unificado de 3 bilhões de parâmetros para texto→vídeo, edição sequencial de vídeos e forte entendimento visual — código disponível, exige GPU com ~40 GB VRAM; LTO (Apple), que usa “surface light field tokenization” para reconstruções 3D view‑dependent mais fiéis que concorrentes; Flash GPO, método eficiente de alinhamento de modelos de vídeo para preferências humanas usando amostragem temporal inteligente (isotemporal grouping e temporal gradient rectification); e Reactive GWM, um modelo gerador de mundos de jogo onde NPCs são controlados por estratégias de alto nível via cross‑attention, permitindo separar ações do jogador das táticas dos oponentes. Todos os projetos têm código aberto e links públicos para experimentação local.