They Got Caught...
Por Matthew Berman
Conteudo
TLDR;
A Anthropic identificou os laboratórios chineses DeepSeek, Moonshot AI e MiniMax como autores de ataques de destilação em sua API do Claude, usando mais de 24 mil contas fraudulentas para gerar 16 milhões de interações. Os ataques de destilação consistem em extrair capacidades de modelos avançados como o Claude para treinar modelos próprios menores e mais eficientes, muitas vezes removendo salvaguardas de segurança. As reações na internet foram intensas, com críticas à Anthropic por hipocrisia, incluindo de Elon Musk, apesar das preocupações de segurança nacional levantadas pela empresa.
Resumo
A Anthropic acusou publicamente três laboratórios chineses de IA de ponta — DeepSeek, Moonshot AI e MiniMax — de realizar ataques de destilação em massa em sua API do modelo Claude. Esses labs criaram mais de 24 mil contas fraudulentas, gerando 16 milhões de interações para extrair capacidades de raciocínio, uso de ferramentas, codificação e chain-of-thought, treinando seus próprios modelos open-source de alta performance. A destilação, técnica legítima para criar versões menores e mais eficientes de modelos grandes, foi usada ilicitamente aqui, permitindo contornar controles de exportação de GPUs e remover salvaguardas de segurança, o que gera riscos nacionais como desenvolvimento de bioweapons ou ciberataques. A Anthropic detectou os ataques via IPs, metadados e padrões anormais: DeepSeek fez 150 mil trocas focadas em raciocínio; Moonshot, 3,4 milhões em agentes e ferramentas; MiniMax, 13 milhões em codificação, inclusive adaptando-se a atualizações do Claude. Apesar das medidas de resposta como detecção e controles de acesso, a internet reagiu com críticas, chamando a Anthropic de hipócrita — inclusive Elon Musk —, e notes da comunidade destacando contradições. O post viralizou com 26 milhões de visualizações, questionando a eficácia dos controles americanos. (198 palavras)