Cohere launches an open source voice model specifically for transcription

TLDR;

Cohere lançou o Transcribe, um modelo de voz open source para transcrição automática de áudio, voltado para tarefas como anotações e análise de fala.. O modelo suporta 14 idiomas e foi projetado para rodar em GPUs de consumo, permitindo que usuários o hospedem por conta própria.. Segundo a Cohere, o Transcribe tem desempenho forte em benchmarks gerais, mas ainda fica atrás de concorrentes ao transcrever português, alemão e espanhol.

Resumo

A Cohere lançou o Transcribe, seu primeiro modelo de voz e reconhecimento automático de fala, em código aberto, voltado para tarefas como anotações e análise de áudio. Com apenas 2 bilhões de parâmetros, ele foi projetado para rodar em GPUs de consumo e para uso em servidores próprios, oferecendo suporte a 14 idiomas, incluindo português. Segundo a empresa, o modelo superou concorrentes como Zoom Scribe v1, IBM Granite 4.0 1B, ElevenLabs Scribe v2 e Qwen3-ASR-1.7B no ranking Open ASR do Hugging Face, alcançando taxa média de erro por palavra de 5,42, a melhor do benchmark. Em avaliações humanas, obteve taxa de vitória média de 61% em critérios como precisão, coerência e utilidade. Apesar disso, apresentou desempenho inferior em português, alemão e espanhol. A Cohere também afirma que o Transcribe processa 525 minutos de áudio por minuto, desempenho alto para sua categoria. O modelo será integrado à plataforma North, disponível gratuitamente via API e também no Model Vault. O lançamento ocorre em meio ao crescimento da demanda por ferramentas de ditado e transcrição, enquanto a Cohere segue ampliando sua atuação no mercado corporativo.

Cohere launches an open source voice model specifically for transcription

Conteudo

TLDR;

Resumo

Relacionados

Instalar YouNews

Instalar YouNews