Este modelo é uma espécie de desastre.
Desastre total: modelo de sucesso vira completo fracasso.
Conteudo
TLDR;
Embora tenha avanços, o modelo às vezes regrede em desempenho, toma decisões de busca estranhas e suas salvaguardas agressivas chegam a bloquear pedidos legítimos, dando a impressão de "desastre". Em muitos aspectos é útil—melhor que o Opus 4.6 em engenharia de software complexa, visão e qualidade de saídas—mas perde para o Mythos em capacidades mais amplas e em alguns benchmarks específicos. Pode ser usado profissionalmente, contudo exige cautela: esteja preparado para limitações, comportamento inconsistente e para cumprir o programa de verificação se for usá‑lo em pesquisas de segurança.
Resumo
Anthropic lançou publicamente o Opus 4.7, um modelo que melhora significativamente sobre o 4.6 em engenharia de software avançada, especialmente em tarefas complexas e de longa duração, com melhor atenção às instruções, verificação interna de saídas e visão de imagem em maior resolução, além de produzir interfaces, slides e documentos mais criativos e profissionais. Não é, porém, o modelo mais potente da Anthropic — esse papel fica com o Claude Mythos preview — e em alguns benchmarks específicos, como Agentic Search, o 4.7 chega a render pior que o 4.6. Na prática o autor relata impressões mistas: momentos de grande eficiência intercalados com regressão comportamental ao longo do uso e decisões de busca estranhas. Para reduzir riscos, Anthropic aplicou salvaguardas que detectam e bloqueiam pedidos de alto risco para usos de cibersegurança, o que levou a interações ambíguas em apps oficiais (bloqueios por suposta injeção de prompt). Profissionais de segurança precisam solicitar participação no programa de verificação cibernética para usos legítimos sensíveis. Opus 4.7 já está disponível via API e nos principais provedores de nuvem, com preços inalterados. O criador dedicou um dia testando o modelo, trazendo relatos específicos, sugestões de uso e um otimismo cauteloso quanto à aplicação prática.