27:58
youtube.com 20/05/2026 SRT AI Coder TODAY

O novo Gemini Omni do Google é demais.

O Gemini Omni do Google promete revolucionar a inteligência artificial.

Google Edição de Vídeo Tecnologia IA

Conteudo

TLDR;

É o novo modelo multimodal de vídeo do Google, anunciado no I/O 2026 como uma versão de "world model" capaz de entender física, raciocinar e trabalhar com múltiplos meios. Se destaca por geração e edição de vídeo muito melhores, incluindo edição vídeo‑a‑vídeo robusta, manutenção de áudio/voz consistente e troca convincente de personagens e cenários. Foi mostrado em demos e experiências práticas no I/O e já aparece em exemplos online, mas o acesso público parece ainda restrito a prévias e usuários especiais (como membros Ultra), sem liberação ampla anunciada.

Resumo

Na conferência I/O 2026 o Google lançou o modelo multimodal Gemini Omni, apresentado como um “world model” capaz de entender e simular o mundo em múltiplas mídias — começando por vídeo — e oferecendo geração e edição significativamente melhores. A companhia também revelou o Gemini 3.5 Flash, um modelo leve e muito rápido que se posiciona perto de concorrentes como Opus 4.7 e GPT‑5.5, além do agente sempre‑ativo Gemini Spark e novidades para produtos como Ask YouTube e Docs Live. Em testes práticos, Omni mostrou entendimento de física, raciocínio complexo e edição vídeo‑a‑vídeo impressionante: foi possível substituir personagens e cenários mantendo consistência de áudio, criar um cientista‑viking explicando flatulência com gráficos instrutivos, e iterar várias edições (incluindo fantasias de abelha e danças em tela) com resultados criativos — embora quebras apareçam após múltiplas gerações. Apesar de acertos notáveis, alguns recursos (semelhantes ao cameo da Sora) apresentaram limites. A cobertura aponta entusiasmo pelo progresso e ressalta que, mesmo com hits surpreendentes, há misses e desafios a serem superados enquanto o Google expande capacidades multimodais rumo a um modelo de mundo. Os apresentadores destacaram experiências práticas, comparações com concorrentes e a promessa de integração futura com áudio, texto e mundos imersivos 3D.