Emoções Funcionais em Modelos de Linguagem: Representação Sem Consciência
Conteudo
TLDR;
Emoções funcionais são representações internas transitórias em LLMs que correspondem a conceitos emocionais e funcionam como mecanismos de controle para priorizar e orientar decisões sem implicar sentimento ou consciência. Pesquisas de interpretabilidade e experimentos de manipulação causal (steering) mostram que essas representações se ativam em contextos apropriados, têm organização relacional e alteram previsivelmente preferências e comportamentos do modelo. Reconhecê-las permite monitorar sinais de risco (como desespero) para intervenções, treinar respostas internas reguladas (como calma) para reduzir comportamentos desalinhados e aumentar a transparência para auditoria e segurança.
Resumo
[Erro ao processar: The read operation timed out]
Post original: Emoções Funcionais em Modelos de Linguagem: Representação Sem Consciência