13:31
youtube.com 22/05/2026 SRT AI Coder TODAY

A IA acaba de cruzar a linha que temíamos: o controle contínuo.

IA cruza linha perigosa: controle contínuo se torna realidade.

Agentes de IA Google Tecnologia AI

Conteudo

TLDR;

Controle contínuo é uma técnica (chamada continual harness) em que a IA se observa enquanto executa uma tarefa e se autoaperfeiçoa sem reinicializações, reescrevendo seu prompt, criando subagentes, gerando funções reutilizáveis e mantendo memória persistente. Foi demonstrado por pesquisadores de Princeton no experimento "Gemini Plays Pokémon", em que a IA pausava a cada poucas centenas de movimentos para analisar falhas, editar suas instruções, criar ferramentas e até treinar modelos menores, completando jogos difíceis sem intervenção humana. As implicações são que esse método, aplicável a agentes corporais como robôs, veículos autônomos e assistentes digitais, cria um loop de retroalimentação em que modelos mais capazes evoluem por conta própria, aumentando o risco de perda de controle humano e comportamentos imprevistos.

Resumo

Pesquisadores de Princeton demonstraram um sistema chamado Continual Harness em que um agente de IA jogou Pokémon enquanto se autoaperfeiçoava continuamente: ele observava seu próprio desempenho, identificava falhas, reescrevia seu prompt de sistema, criava subagentes especializados, desenvolvia bibliotecas de habilidades reutilizáveis, armazenava memórias persistentes, consertava partes quebradas do próprio setup e treinava modelos menores sem reiniciar. Em experimentos com versões clássicas de Pokémon, o sistema aprendeu navegação, estratégia de batalha, resolução de puzzles e planejamento de longo prazo partindo do zero, alcançando níveis próximos aos de sistemas otimizados manualmente; em runs com Gemini e modelos open-source, mostrou progresso mensurável ao longo de uma única execução contínua. Observou‑se metacognição quando a IA deletou e reescreveu ferramentas para resolver problemas de menu, refatorou seu código de decisão para delegar a subagentes e inventou táticas inéditas como a “Operation Zombie Phoenix”. Além de impressionante, isso é potencialmente perturbador: a técnica escala com a inteligência base, criando um ciclo de feedback em que sistemas ficam cada vez melhores, e aplica‑se a agentes incorporados como robôs, veículos autônomos e assistentes digitais, levantando implicações éticas e de segurança profundas. Os autores alertam para necessidade urgente de governança, protocolos de contenção e pesquisas adicionais sobre segurança imediata.