techcrunch.com 15/04/2026 MD Sandbox

This startup is betting tokenmaxxing will create the next compute giant

Tecnologia GPUs Tokenmaxxing

Conteudo

TLDR;

Tokenmaxxing é a estratégia de maximizar a geração e o consumo de tokens para manter inferências de modelos de IA rápidas e baratas, e a Parasail afirma processar cerca de 500 bilhões de tokens por dia. A startup quer virar um gigante de computação ao orquestrar GPUs alugadas em 40 data centers em 15 países e em mercados de liquidez para reduzir custos de inferência, focando em clientes startups e evitando treinamento de modelos. O maior risco é a forte dependência da proliferação de modelos open source e da demanda por inferência, além da volatilidade por ter uma base de clientes concentrada em startups sem compromissos de longo prazo.

Resumo

Parasail, fundada por Mike Henry (ex-executivo da Groq), oferece um serviço de computação em nuvem especializado em inference para modelos generativos, atingindo hoje cerca de 500 bilhões de tokens por dia. A empresa, recém-saída do stealth e com US$32 milhões em Série A, não depende exclusivamente de hardware próprio: opera GPUs próprias e aluga capacidade em 40 data centers em 15 países, além de comprar tempo de processamento em mercados de liquidez para reduzir custos. Focada apenas em inference (sem treinamento), a startup orquestra alocação de workloads para evitar picos de demanda e competir com provedores que possuem silício próprio e clientes corporativos amarrados a contratos. Investidores e executivos veem a expansão de modelos open source e agentes — que fragmentam tarefas e aumentam o volume de consultas — como motor da procura por infraestrutura barata; empresas como Elicit usam modelos locais para pré-filtragem antes de recorrer a modelos frontier. Parceiros de investimento estimam que inference poderá representar ao menos 20% do custo de desenvolvimento de software, enquanto concorrentes incluem Fireworks AI e Baseten. O principal risco é a concentração de clientes em startups early-stage, mas a tese dos investidores é que a demanda de inference já supera a oferta.