Inteligência artificial autoevolutiva, lutas de robôs, nova voz GPT, novo modelo de imagem local,...
Nova era da inteligência artificial: robôs em luta e tecnologias revolucionárias em alta.
Conteudo
TLDR;
A OpenAI lançou seu mais recente modelo de voz em tempo real, descrito como extremamente poderoso e uma verdadeira fera.. O novo modelo de imagem local é o Hydream01 image da Vivago AI, líder open-source em geração de imagens 2K, edição sem VAE, com destaque em renderização precisa de texto e infográficos, rodando em GPUs locais.. As lutas de robôs referem-se às demos ridículas e impressionantes de robôs humanoides apresentadas entre as novidades da semana em IA.
Resumo
Nesta semana agitada no mundo da IA, destacam-se avanços impressionantes. O RecGen, um modelo inovador, reconstrói objetos 3D precisos a partir de poucas imagens RGBD, mesmo com oclusões, superando concorrentes em pose, forma e cenários caóticos. Treinado em 200 mil assets 3D e 3 milhões de imagens sintéticas, seu código já está disponível no GitHub. Outro destaque é o Hydream01 Image, da Vivago AI, novo líder open-source em geração e edição de imagens em 2K, brilhando em renderização de texto, infográficos, pôsteres complexos e layouts multifacetados, sem VAE, com suporte a múltiplas referências. Supera modelos como Qwen Image e Flux em benchmarks, com versões base (50 passos) e dev (28 passos), ambos de 32 GB, prometendo quantizações futuras. Por fim, o UniVid X gera vídeos com características intrínsecas como albedo, irradiância, normais, segmentação e canal alfa, permitindo edições avançadas de foreground e background. Esses lançamentos open-source aceleram a acessibilidade da IA em 3D, imagens e vídeos. (198 palavras)