Stanford, Wiz e CodeRabbit acabam de revelar que a programação com IA tem 2,7 vezes mais bugs.
Programação com IA: 2,7 vezes mais bugs, revelam Stanford, Wiz e CodeRabbit.
Conteudo
TLDR;
Porque estudos como o da CodeRabbit mostram que PRs assistidos por IA têm em média 2,74 vezes mais vulnerabilidades, já que os modelos reproduzem padrões inseguros (bibliotecas desatualizadas, credenciais hard-coded, autenticação fraca) e o código gerado costuma ser aceito sem revisão suficiente. Isso foi demonstrado por vários benchmarks (AppSec Santa, Wiz, Stanford, CodeRabbit, Black Duck) que testaram modelos reais e bases de código em escala usando SAST e validação manual, encontrando taxas como 25,1% de código IA-gerado com vulnerabilidades e 2,74× mais problemas em PRs assistidos. A recomendação é restringir o uso da IA em código sensível, não colar código proprietário em modelos, aumentar revisão manual e varredura com ferramentas de segurança e gerência de dependências, e não confiar cegamente nas sugestões geradas.
Resumo
O vídeo alerta que o uso indiscriminado de IA para gerar ou consertar código amplia riscos já existentes: houve casos reais, como na Samsung, em que engenheiros colaram código e dados internos em ferramentas de IA, expondo propriedade intelectual e forçando restrições internas; estudos de fevereiro de 2026 (AppSec Santa) testaram 89 prompts em seis modelos populares (Copilot, Claude, Gemini, Deep Seek, Llama, Grok), analisaram 534 trechos com Semgrep, CodeQL e validação manual, e, junto com relatórios da Wiz, Black Duck e universidades, mostram padrões consistentes — 25,1% do código gerado por IA tinha vulnerabilidades confirmadas (uma em quatro), com melhores modelos falhando perto de 1 em 5; em 2021 era ~40%. Black Duck aponta bases medianas com 1.180 componentes OSS, 581 vulnerabilidades, 64% dependências transitivas e 93% componentes “zumbis”. Vulnerabilidades repetidas por IA incluem SSRF, injeção e credenciais hard-coded; Wiz encontrou senhas em JavaScript cliente e chaves expostas. Stanford mostrou que desenvolvedores que usam IA introduzem mais falhas mas estão mais confiantes; Code Rabbit revelou PRs assistidos por IA com 1,7× mais problemas, 2,74× mais vulnerabilidades em código de segurança e 188% mais falhas no tratamento de senhas. Como Copilot pode gerar até 46% do código em projetos, a conclusão é clara: IA não cria falhas novas, mas escala as já existentes com aparência de correção, aumentando o risco.