A nova IA da Microsoft é 60 vezes mais rápida que o tempo real (supera os melhores modelos).
Nova IA da Microsoft é 60 vezes mais rápida que o tempo real, superando os melhores modelos.
Conteudo
TLDR;
Refere‑se ao MAI voice one, que gera 60 segundos de áudio em 1 segundo, ou seja, produz áudio 60 vezes mais rápido que a reprodução em tempo real. Segundo os benchmarks apresentados, o MAI transcribe one supera modelos como Whisper Large V3 da OpenAI, Gemini 3.1 Flash em muitas línguas e também compete com ElevenLabs scribe V2 e GPT Transcribe. Os modelos MAI (transcribe one, voice one e image two) estão sendo integrados a produtos Microsoft como Copilot, Bing, PowerPoint e Foundry e serão oferecidos por APIs com preços agressivos (transcrição desde US$0,36/hora; voz US$22 por 1M de caracteres; imagem desde US$5/1M tokens de entrada e US$33/1M tokens de saída).
Resumo
[Erro ao processar: The read operation timed out]