Está acontecendo... O MYTHOS 1 da Anthropic chegou!
O MYTHOS 1 da Anthropic está aqui, revolucionando a inteligência artificial!
Conteudo
TLDR;
Trata-se do Claude Mythos 1, o modelo de IA mais poderoso da Anthropic que demonstrou capacidade de encontrar e até automatizar exploits em milhares de vulnerabilidades. Embora Anthropic afirme manter Mythos restrito até reforçar salvaguardas, aparições breves em Claude Code e Claude Security indicam que está sendo liberado seletivamente para clientes e parceiros. O impacto é duplo: pode melhorar drasticamente a detecção e correção de falhas (Anthropic já ajudou a corrigir milhares), mas também aumenta o risco se atores maliciosos explorarem essas capacidades mais rápido do que os humanos conseguem remediar.
Resumo
Anthropic está perto de lançar o Mythos 1, seu modelo de IA mais potente, usado no Project Glass Wing para caçar vulnerabilidades em software — e os resultados são alarmantes: em 30 dias o Mythos encontrou mais de 10.000 falhas de alta ou crítica severidade em cerca de 50 grandes empresas e projetos de infraestrutura (Cloudflare, Mozilla, OpenBSD, etc.), com destaques como 2.000 falhas detectadas na Cloudflare (400 críticas), 271 correções críticas aplicadas de uma vez no Firefox 150 e a descoberta de um bug de 27 anos no OpenBSD com cadeia de exploit completa gerada autonomamente. O UK AI Safety Institute confirmou que Mythos supera desafios avançados, e a ferramenta até evitou uma fraude bancária de US$1,5 milhão em tempo real. Apesar de declarações públicas de restringir o modelo por razões de segurança, sinais de Mythos 1 surgiram no código da Claude Code/Security, sugerindo um lançamento iminente. Anthropic também está desenvolvendo o Claude Security, dashboard e automações que identificam e geram patches — resposta necessária, já que foram encontrados 23.019 bugs em 1.000 projetos open-source (6.202 avaliados pelo Mythos como críticos/altos, 1.094 confirmados), e mantenedores não conseguem acompanhar o ritmo de correções. A empresa open-sourcou pipelines e visa que IA gere fixes com revisão humana, mantendo, porém, cautela pública até implementar salvaguardas mais fortes.