1:04:21
youtube.com ha 5 dias SRT AI Coder TODAY

This Week in AI | 7th May 2026

Tudo o que você precisa saber sobre inteligência artificial esta semana!

Investimento Tecnologia Gemma 4 Meta

Conteudo

TLDR;

Os destaques incluem um grande investimento da Nvidia/Corning em fibra óptica com novas fábricas e milhares de empregos, avanços de performance no Gemma 4 por meio de decodificação especulativa e pesquisas sobre "abstract chain of thought" que movem o raciocínio para o espaço latente. A aceleração do Gemma 4 usa decodificação especulativa (previsão multi-token/multithreading) para reduzir latência sem perda de qualidade, com otimizações específicas de hardware e algum custo adicional de cache. O "abstract chain of thought" faz o modelo raciocinar internamente no espaço latente em vez de produzir tokens de pensamento visíveis, o que pode acelerar a inferência ao custo de menor interpretabilidade.

Resumo

No episódio, os apresentadores conversam brevemente sobre a semana curta e incentivam a participação do público antes de abordar notícias importantes: grandes investimentos em infraestrutura para IA, como a notícia de que a Nvidia está envolvida em um aporte de US$ 3,2 bilhões com a Corning para fibra óptica e três novas fábricas voltadas a IA, destacando que esse tipo de capex sustenta toda a cadeia — redes rápidas, energia e GPUs — gera empregos e valor econômico (a Corning subiu 250% no ano e fechou acordo de US$ 6 bilhões com a Meta). Em seguida, falam de avanços técnicos: aceleração do Gemma 4 por meio de predição multi-token (decodificação especulativa) que reduz latência sem perda de qualidade ao amostrar da mesma distribuição de probabilidade, com otimizações específicas de hardware; e a ideia de “abstract chain of thought”, que transfere o raciocínio do modelo para o espaço latente em vez de gerar tokens visíveis, tornando o processo menos explicável porém mais rápido — esses “tokens abstratos” são vetores de embedding não legíveis por humanos e podem ser armazenados ou cacheados para acelerar inferência. O episódio menciona pesquisas e posts técnicos para quem quiser se aprofundar e cita brevemente o “Quen’s scope” ao final.