GRANDE ATUALIZAÇÃO: Google acaba de cortar custos de IA em 45% - Seu modelo mais barato agora sup...
Google reduz custos de IA em 45% com modelo mais barato revolucionando o mercado de inteligência artificial.
Conteudo
TLDR;
O Google lançou o modelo Gemini 3.5 Flash Low na plataforma anti-gravity, que gera cerca de 45% menos tokens que o Flash Medium. Apesar de usar menos tokens, esse modelo supera o Gemini 3 Flash High em benchmarks de engenharia de software, indicando ganho de eficiência sem perda de desempenho nessas tarefas. A mudança, acompanhada de reset de cotas, é uma estratégia econômica para reduzir custos de uso por desenvolvedores e incentivar mais experimentação e adoção na plataforma.
Resumo
Google reconheceu o que muitas empresas de IA evitam admitir: modelos maiores nem sempre são melhores e mais tokens não significam resultados superiores — e, sobretudo, custam caro. Diante de relatos como o cancelamento de ferramentas internas pela Microsoft por cobrança por token e o esgotamento precoce do orçamento de IA da Uber, a companhia lançou no Anti‑Gravity o Gemini 3.5 Flash Low, criado pelo time DeepMind, que produz cerca de 45% menos tokens que o nível médio e ainda supera a geração anterior em benchmarks de engenharia de software, além de reajustar cotas nos planos pagos. A proposta segue uma estratégia econômica: oferecer três níveis de "pensamento" (low, medium, high) para usar a menor inteligência necessária em tarefas triviais — renomear variáveis, consertar sintaxe, gerar boilerplate — reservando modelos pesados para problemas realmente complexos. Isso reduz custos, incentiva experimentação e prende desenvolvedores ao ecossistema Google. Ao mesmo tempo surgem críticas sobre mudanças de UI e fluxos de trabalho que aproximam a plataforma de uma experiência de "codificação ampla" e alteram expectativas. O anúncio sinaliza uma mudança maior na indústria, da corrida por máxima inteligência para a busca por eficiência e acessibilidade econômica da IA. E isso tem impacto global.