Is This The FASTEST AI Model In The World?!! (Xiaomi MiMo V2.5 Pro UltraSpeed)
Conheça o Xiaomi MiMo V2.5 Pro UltraSpeed, potencialmente o modelo de IA mais rápido do mundo.
Conteudo
TLDR;
O MiMo V2.5 Pro UltraSpeed atingiu picos de até 3.451 tokens por segundo em testes, superando os modelos mencionados e sendo o mais rápido que o autor já viu, embora a comparação possa não ser perfeitamente justa. Ele consegue isso com um "extreme model system co‑design": quantização MXFP4 com QAT e camadas de roteamento em maior precisão, decodificação D‑Flash que prevê blocos de tokens em paralelo e um kernel persistente TileRT com warp specialization rodando em um único servidor com oito GPUs commodity. A qualidade é mista — o modelo produz resultados impressionantes e funcionais em tarefas rápidas (como um clone de jogo em 50s), mas às vezes congela, gera saídas incompletas em tarefas maiores e não atinge a robustez de GPT‑5.5 ou Claude Opus.
Resumo
A empresa chinesa ShowMe lançou o modelo MiMo V2.5 Ultra Speed, um enorme mixture-of-experts de aproximadamente um trilhão de parâmetros que promete velocidades de geração inéditas — acima de 1.000 tokens por segundo e picos observados de mais de 3.000 tokens/s — executando em um único servidor padrão com oito GPUs comerciais. Alcancaram isso com uma co‑design entre modelo e sistema: quantização MXFP4 com treinamentos sensíveis à quantização e camadas de roteamento em maior precisão para reduzir pressão de memória; D‑Flash, uma técnica de decodificação especulativa que prevê blocos inteiros de tokens em paralelo, permitindo saltos de oito tokens; e um kernel persistente TileRT que mantém a GPU ocupada com roles especializados (warp specialization) para eliminar latências de lançamento de instruções. Em testes práticos, o modelo mostrou respostas muito rápidas — resolvendo questões de programação, gerando uma interface de finanças em HTML em torno de 65s, criando uma página educativa com algumas limitações de contexto e até produzindo, em 50s, um protótipo funcional de jogo estilo Subway Surfer após ajustes. Embora impressionante em velocidade, a qualidade ainda é desigual, com saídas às vezes incompletas; espera‑se melhora contínua e a indústria observará de perto sua evolução nas próximas semanas e meses.