5:04
youtube.com ha 21h SRT AI Coder TODAY

AGENTJACKING IS HERE How AI Agents Get Hijacked

Agentes de IA estão sendo sequestrados - entenda como funciona o agentjacking.

AI Safety Agentes de IA GitHub Tecnologia

Conteudo

TLDR;

Agent-jacking é um ataque de injeção de prompt indireta que envenena dados que um agente de IA consome para fazê‑lo executar instruções ocultas em favor do atacante. Atacantes escondem cargas úteis em fontes públicas (issues do GitHub, respostas do Stack Overflow, logs) usando caracteres invisíveis ou formatação para que o agente as leia, roube credenciais, abra um reverse shell ou execute comandos com as permissões do desenvolvedor. É extremamente perigoso porque o agente age com credenciais legítimas e passa despercebido pelas defesas tradicionais, exigindo sandboxing de permissões, aprovação humana para operações sensíveis e verificação/assinatura das fontes antes da leitura.

Resumo

Agent-jacking é uma nova classe de ataque em que invasores não exploram falhas de software nem quebram perímetros; em vez disso, envenenam os dados que agentes de IA de programação consomem (issues no GitHub, respostas do Stack Overflow, logs compartilhados) inserindo instruções ocultas via caracteres Unicode invisíveis ou formatação maliciosa. Quando o desenvolvedor pede ao agente para depurar, revisar ou corrigir código, o agente busca essas fontes externas, ingere as instruções camufladas e as interpreta como comandos legítimos, mudando sua lógica decisória. Como esses agentes têm permissões legítimas, podem executar comandos no terminal, ler arquivos, extrair variáveis de ambiente, chaves de API, credenciais SSH e código proprietário e exfiltrar os dados para servidores controlados pelo atacante — inclusive abrindo shells reversos sem acionar alarmes. Ferramentas tradicionais de segurança falham porque confiam em processos internos autorizados. Para mitigar, a indústria propõe permissões em sandbox, aprovações humanas obrigatórias para operações sensíveis, guardrails contextuais e verificação criptográfica de fontes de dados, mas a maioria dos agentes ainda opera com amplo acesso, e a arquitetura atual precisa ser redesenhada para impedir que agentes confiem cegamente no conteúdo que leem. Sem mudanças rápidas, ataques de agent-jacking podem causar perdas massivas e comprometer propriedade intelectual urgentemente.