17:21
youtube.com 26/04/2026 SRT AI Coder TODAY

My Honest Thoughts about Deepseek

Matthew Berman compartilha suas opiniões sinceras sobre Deepseek.

Geopolítica Tecnologia IA DeepSeek

Conteudo

TLDR;

DeepSeek V4 é um modelo open‑source de ponta lançado em duas variantes (Pro e Flash) com contexto de um milhão de tokens, arquitetura mixture‑of‑experts (≈1,6 trilhão de parâmetros totais com 49 bilhões ativos no Pro e 284 bilhões/13 bilhões no Flash) e cerca de 33 trilhões de tokens de treino, oferecendo fortes capacidades de raciocínio e agenticidade. Em benchmarks ele fica um pouco atrás dos melhores modelos fechados (como GPT‑5.5 e Opus 47) mas chega muito perto em desempenho prático, rivaliza em codificação e raciocínio e custa uma fração do preço, sendo suficiente para a maioria dos casos de uso. Por ser muito mais eficiente, barato, aberto e capaz de rodar em GPUs “nerfadas”, DeepSeek reduz a vantagem computacional dos EUA e evidencia que controles de exportação sozinhos não impedem o avanço graças a melhorias algorítmicas e ao aumento de uso (Jevons Paradox).

Resumo

Deepseek lançou o V4, um modelo flagship aberto, potente e muito mais barato, cujo impacto pode reduzir a vantagem americana em IA — não por terem mais chips, mas pela eficiência e consequências geopolíticas. Diferente de reviews técnicos, o ponto maior é que laboratórios chineses open-source vêm alcançando modelos de fronteira com recursos e GPUs “nerfadas”, graças a avanços algorítmicos e transparência (white paper detalhado, admitindo falhas). V4 tem preview em duas versões: Pro (1,66 trilhões de parâmetros totais com 49 bilhões ativos, Mixture of Experts, contexto de 1 milhão de tokens) e Flash (284B totais, 13B ativos, econômico e rápido); ambos treinados com ~33 trilhões de tokens. Apresenta capacidades agentivas, amplo conhecimento de mundo, raciocínio de alto nível e desempenho em benchmarks próximo aos melhores fechados (GPT-5.4/5.5, Opus 4.7), embora levemente atrás, mas suficiente para a maioria dos usos por custar muito menos — um problema para os EUA. Isso levanta dúvidas sobre a eficácia de controles de exportação: sem tanto compute, controles ajudam, mas inovações algorítmicas e rotas alternativas podem contornar limitações, mudando a competição global. O movimento também reacende debates sobre segurança, espionagem tecnológica, dependência de fornecedores e necessidade de políticas públicas e investimentos estratégicos mais urgentes.