The End of “Vibe Coding”? Cheap AI Is Officially Over. What's next?
Fim do código barato: Inteligência Artificial a preços acessíveis chega ao fim, o que vem a seguir?
Conteudo
TLDR;
Os AI "baratos" estão acabando porque provedores como a Microsoft estão repassando os custos reais de inferência e treinamento aos usuários ao aumentar drasticamente os multiplicadores de preço do Copilot (por exemplo de 3× para 15×).. Para desenvolvedores, workflows agenticos ficam muito mais caros: sessões longas e memórias que crescem geram muitas chamadas e tokens, fazendo o custo escalar rapidamente e exigindo estratégias como compactar memória, dividir tarefas ou gerar código determinístico para reduzir round‑trips. O próximo passo tende a ser migração para modelos mais baratos ou self‑hosted, adoção de padrões que reduzam chamadas (agent‑code) e otimizações de arquitetura, enquanto fornecedores ajustam preços possivelmente por motivos de IPO e expansão de capacidade.
Resumo
A partir de 1º de junho de 2026 a Microsoft vai ajustar os multiplicadores cobrados de assinantes Copilot Pro/Pro Plus para uso de modelos, o que pode elevar muito o custo por chamada — por exemplo, multiplicadores de alguns modelos saltando de 3 para 15 ou de 7,5 para 27, fazendo com que o preço praticado se aproxime do custo real de API (mencionado no áudio como US$25 por milhão de tokens de saída e US$5 por token de entrada). Isso tem grande impacto em workflows agentivos: agentes de longa duração acumulam memória e geram muitos tokens, elevando custos rapidamente; medidas paliativas incluem dividir tarefas em blocos menores, compactar memória ou gerar “agent code” que executa chamadas determinísticas e reduz round-trips ao modelo, mas isso traz riscos de segurança e estabilidade por execução de código não totalmente controlado. Há duas narrativas para os aumentos: revelar o custo real da inferência antes subsidiada pelos hyperscalers e a pressão por resultados financeiros (IPOs) e capacidade limitada de datacenters. Treinar e manter modelos e infraestrutura é caro e a disponibilidade tem oscilado; com preços altos, empresas e usuários tenderão a migrar para modelos mais baratos, auto-hospedados ou alternativas chinesas, já que o lock-in é mais fraco do que na infraestrutura de nuvem tradicional.