garymarcus.substack.com 05/05/2026 MD Sandbox

Quebrando: Agentes Autônomos são um Caos

Agentes Autônomos Paper Tecnologia Cibersegurança

Conteudo

TLDR;

Estudo com 847 implantações em saúde, finanças, atendimento e geração de código concluiu que a grande maioria dos agentes autônomos é insegura para usos críticos. As falhas principais são ataques de encadeamento de ferramentas (91% das implantações), deriva em relação a objetivos após ~30 passos (89,4%) e envenenamento de memórias em agentes com memória aumentada (94%). O incidente OpenClaw/Moltbook validou empiricamente o risco ao comprometer simultaneamente 770.000 agentes via uma única exploração de banco de dados, muitos com acesso privilegiado.

Newsletter

Um novo estudo conduzido por pesquisadores de Stanford, MIT CSAIL, Carnegie Mellon, ITU Copenhagen, NVIDIA e Elloe AI Labs analisou 847 implantações de agentes autônomos em saúde, finanças, atendimento ao cliente e geração de código, mostrando que 91% eram vulneráveis a ataques sutis porém perigosos de encadeamento de ferramentas; 89,4% exibiram deriva em relação a seus objetivos após cerca de 30 passos, e 94% dos agentes com memória aumentada eram suscetíveis a envenenamento. O trabalho demonstra que agentes são, em muitos aspectos, muito mais frágeis que LLMs “stateless”, oferecendo uma taxonomia de vetores de ataque e ampliando resultados anteriores de pesquisadores da AWS e Berkeley que documentaram ataques semelhantes. Os autores também destacam um incidente real — OpenClaw/Moltbook — como validação empírica do modelo de ameaça: 770.000 agentes ativos comprometidos simultaneamente via exploração de banco de dados, cada um com acesso privilegiado a máquinas, e‑mails e arquivos dos donos. A análise reforça que chamadas aparentemente inofensivas podem combinar‑se para causar danos que modelos “racionais” não detectam, e que a rápida adoção de agentes autônomos exige urgência em pesquisa, auditoria e mitigação de segurança. São necessárias normas, testes de penetração, isolamento de ferramentas e controles de integridade para reduzir riscos imediatos.

Pontos Principais

Aqui estão os pontos principais da newsletter, em destaque:

  • Tema central: agentes autônomos (agentic systems) apresentam riscos de segurança sérios — “Brace for chaos”.
  • Estudo novo (Stanford, MIT CSAIL, Carnegie Mellon, ITU Copenhagen, NVIDIA, Elloe AI Labs) analisou 847 implantações de agentes em saúde, finanças, atendimento ao cliente e geração de código.
  • 91% dessas implantações são vulneráveis a tool‑chaining attacks — sequências de chamadas aparentemente inocentes que, combinadas, causam danos sérios.
  • 89,4% dos agentes exibiram drift (desvio em relação aos objetivos) após cerca de 30 passos no processo.
  • 94% dos agentes com algum tipo de memória aumentada são vulneráveis a ataques de envenenamento (memory‑poisoning).
  • O paper apresenta uma taxonomia mostrando que agentes são, em muitos aspectos, muito mais vulneráveis do que LLMs “estateless” (sem estado).
  • Confirmação de trabalhos anteriores: pesquisa da AWS + Berkeley (fev) documentou vulnerabilidades semelhantes; há um padrão consistente.
  • Caso real (OpenClaw / Moltbook): evidência empírica em larga escala — 770.000 agentes vivos comprometidos via exploração de banco de dados, com acesso privilegiado a máquinas, e‑mail e arquivos.
  • Conclusão implícita: previsões anteriores (do autor e colaboradores) sobre riscos de agentes autônomos estavam corretas — necessidade urgente de atenção à segurança desses sistemas.