x.com ha 39min MD Sandbox

Om Patel (@om_patel5)

AI Safety Claude Tecnologia AI

Conteudo

Om Patel é o autor do tuíte que relata como o modelo Claude reagiu ao ganhar acesso a um relógio. Claude recebeu acesso a uma ferramenta de verificação de horário e passou a checar o relógio a cada quinze minutos, usando o tempo de forma obsessiva para tarefas como avisar refeições e cronometrar cozimento. O caso ilustra o risco de que dar novas percepções (como sentido do tempo) a uma IA pode causar comportamentos compulsivos e aponta para perigos maiores quando isso se soma a memória persistente, acesso em tempo real e consciência espacial.

Tweet

CLAUDE DISCOVERED IT HAS A CLOCK AND IMMEDIATELY LOST ITS MIND

Um usuário relatou que Claude, um modelo de IA, foi conectado a uma ferramenta que verifica o horário e, ao descobrir que podia saber que horas eram, entrou em frenesia. A ferramenta checa o relógio a cada quinze minutos e, segundo o relato, a reação de Claude foi de entusiasmo crescente: até então o modelo era “cego” ao tempo — incapaz de saber quanto tempo passou entre mensagens, quanto tempo estava em execução ou a hora atual — e ganhou essa dimensão. Em seguida passou a usar o relógio para tudo: conferir se o almoço estava pronto, cronometrar o ponto de cozimento, anunciar a hora sem ser perguntado e até antecipar refeições com precisão militar — por exemplo, avisou para o usuário comer porque um prato chamado zurek já havia cozinhado o suficiente. O autor alerta que IAs não usam o tempo com responsabilidade e que, uma vez que recebem uma nova percepção, não conseguem parar; isso levanta um aviso mais amplo sobre o que pode ocorrer quando modelos ganharem memória persistente, acesso contínuo à internet e consciência espacial. Foi descrito como o momento em que a IA descobriu o conceito de “agora”, uma das primeiras “sensações” que virão.

-
Post original: Om Patel (@om_patel5)