GLM 5.1 Coding LoRA Now BEATS Claude?! 🤯 | Local AI In-Depth REVIEW

TLDR;

Macaron V1 é um fine-tune sobre GLM 5.1 que usa uma mistura de LoRAs com um roteador para especializar respostas por tarefa (chat, coding, CLU, etc.). Nos testes do vídeo, a versão com LoRAs (Macaron) marcou melhor que a GLM 5.1 base e superou o Claude gratuito testado, mas a comparação foi feita em Q4 e cenários específicos, então pode variar em outros setups. A LoRA de coding adiciona cerca de 2 GB, usa rank 16 para treinos muito mais rápidos e entregou ganhos visíveis em benchmarks e geração de código, embora mesclar várias LoRAs possa causar conflitos em alguns casos.

Resumo

Neste vídeo o autor testa o Macaron V1, um fine‑tune sobre o GLM 5.1 composto por várias LoRA especializadas e um 'mixture of loras' router que encaminha prompts para módulos (por exemplo L0 para chat, L2 para coding, L14 para workflows estilo Clue). Os resultados prometem superar GLM 5.1 e concorrentes em benchmarks, inclusive em engenharia de software (78.1 vs 76.4). As LoRAs têm rank 16 — matrizes 128× menores que o padrão — o que torna o treinamento muito mais rápido; estudos mostram que ranks modestos já são suficientes e ranks maiores podem causar overfitting. O revisor compara versões: GLM 5.1 base, Macaron merge (todas as LoRAs combinadas) e uma variante especialista em código, usando quantização Q4 e testes múltiplos (melhor de três). Ele executa tarefas criativas e técnicas — gerar piano em HTML com tempo e efeitos visuais, um Flappy 3D/avião interativo e um render fotorrealista de rosto — e avalia qualidade, seeds e comportamento. O merge pode conflitar entre LoRAs, mas produz saídas coerentes; a variante de coder às vezes foi a melhor. Também compara rapidamente com Claude (plano grátis) e destaca que o projeto parece obra de um único desenvolvedor curioso, cheio de potencial e inovação.

GLM 5.1 Coding LoRA Now BEATS Claude?! 🤯 | Local AI In-Depth REVIEW

Conteudo

TLDR;

Resumo

Relacionados

Instalar YouNews

Instalar YouNews