scientificamerican.com ha 16h MD Sandbox

Até especialistas são surpreendidos pelo último avanço do AI em 'vibe-mathing'

Inteligência Artificial Tecnologia Teoremas OpenAI

Conteudo

TLDR;

É a prática informal de testar prompts em grandes modelos de linguagem para ver se as “vibes” do AI geram ideias ou provas matemáticas úteis. Um usuário sem formação avançada usou GPT‑5.4 Pro para obter uma prova nova de um problema de Erdős sobre conjuntos primitivos e o comportamento limite do chamado "Erdős sum", que especialistas revisaram e condensaram. A saída inicial do modelo era desorganizada e precisou de revisão humana para ficar rigorosa, e embora o novo método pareça promissor, ainda é cedo para avaliar seu impacto a longo prazo.

Resumo

Liam Price, um jovem de 23 anos sem formação matemática avançada, usou uma única solicitação ao ChatGPT (GPT‑5.4 Pro) e obteve uma solução para um problema aberto de Erdős que vinha sem resposta há 60 anos sobre conjuntos primitivos — coleções de inteiros em que nenhum elemento divide outro — e o comportamento do chamado "soma de Erdős" quando os elementos crescem. Enquanto pesquisadores como Terence Tao e Jared Duker Lichtman já haviam estudado variações do problema (Lichtman demonstrou em 2022 que o máximo da soma é atingido pelos números primos), ninguém havia conseguido provar a conjectura limite; a demonstração sugerida pelo LLM empregou uma fórmula conhecida em áreas relacionadas, mas até então não aplicada a essa questão, escapando do caminho que todos os humanos haviam seguido. O texto bruto do ChatGPT exigiu refinamento por especialistas, que encurtaram e clarificaram a prova e elogiaram o insight inédito, vendo potencial para aplicações mais amplas. Price compartilhou o resultado em erdosproblems.com com seu colaborador Kevin Barreto; o caso reaviva o debate sobre o papel da IA na matemática, pois demonstra que modelos podem inspirar novas abordagens, embora continuem a depender de verificação e polimento humano e de julgamento crítico da comunidade científica.