2:10
youtube.com ha 4 dias SRT AI Coder TODAY

Roteamento de modelos de IA: como os modelos chineses estão dominando o uso da IA

Modelos de IA chineses dominam o uso da inteligência artificial no mundo.

Tecnologia China IA Anthropic

Conteudo

TLDR;

Roteamento de modelos é a estratégia de encaminhar tarefas simples para modelos de IA mais baratos e reservar os modelos de ponta para tarefas complexas, reduzindo custos operacionais. Modelos chineses open‑source (como DeepKI) estão ganhando participação porque executam muitas tarefas com qualidade suficiente por uma fração do custo — estudos citam até 19× ou mesmo 10–50× mais baratos — e assim atraem uso massivo. Isso faz com que empresas reduzam gastos sem cortar ferramentas de IA e que investidores passem a olhar mais para disciplina de preços do que apenas crescimento, mudando a dinâmica do mercado.

Resumo

Nos mercados, houve uma pequena correção após ganhos iniciais, enquanto no universo da inteligência artificial ganhou destaque o conceito de "model routing", que reduz custos ao direcionar perguntas e tarefas mais simples para modelos mais baratos, preservando os modelos de ponta para casos em que realmente agregam valor. Empresas sentem o "sticker shock" dos gastos com IA e buscam maneiras de cortar despesas sem sacrificar ferramentas essenciais. A startup Cognition, voltada para produtividade de código e avaliada em US$26 bilhões, enfatiza essa estratégia: seu fundador Scott Wu observa que grande parte das tarefas — talvez 50% a 70% — não exige a inteligência mais avançada. Em termos práticos, executar a mesma carga de trabalho em um modelo top como alguns da Anthropic pode sair 19 vezes mais caro do que usar modelos open source chineses como o Deepki; outros modelos também podem ser de 10 a 50 vezes mais baratos. Isso tem levado a maior adoção de modelos open source chineses por terceiros e, para investidores, significa que a demanda por IA continua crescendo, mas os gastos tornam-se mais disciplinados, mudando o foco de um roteiro puramente de crescimento para uma história com mais ênfase em poder de precificação, adicionalmente.