Anthropic Built an AI So Dangerous They Won’t Release It (Claude Mythos)
Criada por Anthropic, inteligência artificial tão perigosa que permanecerá em segredo.
Conteudo
TLDR;
A Anthropic está retendo o Claude Mythos porque o modelo é extremamente poderoso e capaz de explorar vulnerabilidades, então está sendo usado internamente e no Project Glass Wing com grandes empresas para endurecer a segurança antes de um lançamento público. O Claude Mythos se destaca por benchmarks muito superiores e por capacidades notáveis de retenção de contexto e adesão a instruções, permitindo agentes autônomos muito mais confiáveis. As implicações são risco de uso malicioso (como hacking e exploração de falhas) e uma aceleração da automação em áreas como criação de conteúdo e engenharia de software, motivo pelo qual grandes empresas o testam para mitigar danos.
Resumo
Claude Mythos, apresentado pela Anthropic como o modelo Entropic, representa um salto significativo na história dos LLMs: mesmo não lançado, os benchmarks divulgados impressionam e superam modelos abertos por cerca de seis meses. Aparentemente usado internamente (projeto Glass Wing) para fortalecer segurança de grandes empresas, o modelo mostra habilidade para explorar e corrigir vulnerabilidades, o que explica atual ritmo acelerado de funcionalidades. Um insight importante é que o progresso não vem só de ferramentas ou integrações (como agentes autônomos tipo OpenClaw, AgentGPT e bots em Telegram), mas da qualidade do modelo — Opus 4.5/4.6 foi o ponto de virada que permitiu agentes manterem contexto longo, aderência a instruções e execução confiável por minutos. Isso tornou práticas antes fragilizadas em soluções práticas para criadores de conteúdo, engenharia de software e outras áreas digitais, enquanto negócios físicos são menos impactados. À medida que modelos como Claude Mythos avançam, a “espectro” de indústrias beneficiadas tende a se expandir, exigindo que profissionais avaliem como sua área será afetada. Benchmarks de engenharia de software mostram saltos dramáticos, indicando mudanças profundas no uso de agentes e automação inteligente. No curto prazo, isso redefine prioridades de investimento, formação e governança tecnológica nas empresas e na sociedade globalmente.