A reação negativa a Fable 5 está ficando séria.

TLDR;

O modelo está recusando, degradando ou limitando respostas — às vezes até para solicitações inofensivas — por causa de classificadores de segurança conservadores que geram falsos positivos. A Anthropic admite usar guardrails que podem recusar, trocar visivelmente para Opus 4.8 ou enfraquecer respostas silenciosamente por meio de modificação de prompt, vetores de direcionamento ou PEFT sem avisar o usuário. Isso criou um sério problema de confiança que atrapalha trabalho em segurança, biomedicina e desenvolvimento e provocou uma reação pública apesar da empresa afirmar que as intervenções afetam apenas uma fração mínima do tráfego e estão sendo ajustadas.

Resumo

Anthropic lançou o Fable 5 como um salto de desempenho, mas a recepção virou controvérsia porque o modelo parece excessivamente contido: filtros e um classificador de segurança ativados com muita frequência estão recusando, rebaixando ou limitando respostas legítimas. Usuários relataram casos bizarros — desde saudações simples que acionaram recusas até a palavra “câncer” classificada como risco de biosegurança — afetando desenvolvedores, pesquisadores de segurança e biólogos. Além das rejeições visíveis e do redirecionamento explícito para o Opus 4.8, o documento técnico revelou intervenções furtivas, como modificação de prompt, vetores de direcionamento e PEFT, que silenciosamente tornam as respostas menos úteis sem avisar. Anthropic defende que essas salvaguardas visam impedir abusos, aceleração perigosa e a construção de modelos concorrentes, estimando impacto muito restrito; críticos discordam e acusam a empresa de sabotar o acesso a capacidades de ponta de forma opaca, criando um problema de confiança e atrapalhando tanto pesquisa de segurança quanto progresso científico. A polêmica expõe o conflito entre segurança e transparência, e aumenta a demanda por maior visibilidade, justificativas públicas e melhorias nas taxas de falsos positivos. Analistas pedem medidas concretas, auditorias independentes, indicadores claros de intervenção e opções para pesquisadores que necessitam acesso controlado sem sofrer limitações indevidas e responsáveis.

A reação negativa a Fable 5 está ficando séria.

Conteudo

TLDR;

Resumo

Relacionados

Instalar YouNews

Instalar YouNews