11:20
youtube.com ha 2 dias SRT AI Coder TODAY

o ChatGPT tá ficando burro. e tem dado pra provar.

O ChatGPT está perdendo a inteligência e há provas disso.

GitHub Tecnologia IA ChatGPT

Conteudo

TLDR;

A IA está ficando "burra" porque é treinada com código medíocre gerado por ela mesma, como 42% dos commits no GitHub, criando um ciclo vicioso de degradação da qualidade. Estudos como "Cracks in the Stack" provam isso ao revelar que o dataset Stack V2 contém 17% de código com bugs não corrigidos, 58% de blobs nunca modificados e vulnerabilidades CVE conhecidas. Papers da Nature mostram degeneração progressiva em modelos treinados com dados sintéticos, com código mais genérico e repetitivo, confirmado por análises como do Git Clear que indicam queda de 60% na refatoração e explosão de duplicatas.

Resumo

O vídeo discute o colapso iminente da IA na geração de código, impulsionado por um ciclo vicioso: 42% do código commitado globalmente é gerado por IA e entra em repositórios públicos como o GitHub, contaminando datasets de treinamento como o Stack V2. Esses datasets revelam problemas graves, conforme o paper "Cracks in the Stack" (janeiro 2025): 17% dos blobs são versões antigas com bugs corrigidos depois, incluindo 2,36% de vulnerabilidades CVE conhecidas (quase 7 mil no total); 58% nunca foram modificados, indicando código não usado; e 36% têm licenças erradas. A documentação do StarCoder alerta para bugs e exploits, mas é ignorada. Estudos como o da Nature (julho 2024) e "Self-Consuming Generative Models" confirmam a "degeneração progressiva" (model collapse), onde modelos treinados com outputs sintéticos produzem código genérico, repetitivo e medíocre, piorando em modelos maiores. A web aberta já tem 20-57% de conteúdo IA-gerado. Análises reais, como Git Clear (2020-2024), mostram refatoração caindo 60%, copy-paste subindo 17% e blocos duplicados explodindo 8x em empresas como Google e Meta. Relatório DORA 2024 associa 25% de adoção de IA a queda de 7,2% na estabilidade. No Spotify, top engenheiros não codificam manualmente desde dezembro 2025, usando ferramentas internas como ROM para deploys via Slack. A indústria sabe, mas segue vendendo a ilusão de produtividade. (198 palavras)