18:02
youtube.com ontem SRT AI Coder TODAY

Codificação local de IA com Qwen 3.6 27B no NVIDIA DGX Spark

Desbloqueie o poder da IA local com Qwen 3.6 27B no NVIDIA DGX Spark.

Codificação Tecnologia Qwen

Conteudo

TLDR;

Roda bem no NVIDIA DGX Spark e, com 262K de contexto e alta utilização, entrega boa qualidade de código quando a velocidade de geração não é prioridade. Comparado a modelos de ponta como Opus 4.8 ou Codex, o Qwen 3.6 27B pode alcançar qualidade próxima com o meu harness, mas é mais lento e menos imediatamente preciso que esses líderes. Para obter código TypeScript confiável é indispensável um harness robusto com guardrails, parsers, linters, pré-commit hooks e ferramentas específicas que corrijam chamadas de ferramenta e evitem alucinações.

Resumo

Nas últimas semanas experimentei modelos locais no DGX Spark, especialmente Qwen 3.6 27B, e compartilho descobertas sobre parâmetros, posts do Reddit e o harness que construí. Minha conclusão: modelos locais podem gerar código bom — em TypeScript, com regras e ferramentas adequadas, o Qwen 3.6 27B produz resultados quase comparáveis ao Opus 4.8, mas a geração é mais lenta (menos tokens/s). Modelos otimizados para velocidade tendem a produzir lixo mais rápido; qualidade exige modelos mais lentos ou guardrails rigorosos. Testei várias quantizações (por exemplo, 35B/3B ativos) e vi que velocidade sem correção torna o processo ineficiente. Por isso desenhei um harness TypeScript especializado com linters, pre-commit hooks, parsers e ferramentas que tornam agentes quase determinísticos e corrigem chamadas de ferramentas malformadas — no demo o harness intercepta erros, força a chamada certa e scaffolda um app TypeScript com Vite, cria tipos (I ToDo) e aplica boas práticas. Reforço que, sem um bom tooling específico para sua linguagem (Go, Rust, etc.), esses modelos falham. Ainda não publiquei o harness, mas deixarei detalhes e configurações no repositório. Também fiz transmissões ao vivo mostrando VODs e prometo publicar no GitHub instruções, configurações, métricas de desempenho e exemplos de uso em breve para todos.