9:31
youtube.com 06/02/2026 SRT AI Videos

GPT 5.3 is here and it's INSANE for Coding

Por Matthew Berman

AI agente Tecnologia

Conteudo

TLDR;

O GPT‑5.3 Codeex traz melhorias grandes para programação: permite direcionamento (steering) durante a tarefa, age como agente autônomo em trabalhos longos e entrega resultados melhores com muito menos tokens. O ganho de velocidade não veio de inferência mais rápida, mas de precisar de bem menos tokens de saída para alcançar os mesmos resultados (por exemplo 43.000 tokens no 5.3 vs 91.000 no 5.2), o que explica o ~25% de aumento reportado. Em comparação com concorrentes, OpenAI e Anthropic estão indo cabeça a cabeça — Codeex é apontado por alguns como o melhor para codificação e está reduzindo a diferença de desempenho/velocidade, enquanto Claude ainda se sobressai em tarefas de conhecimento não‑codificador como manipulação de arquivos e apresentações.

Resumo

OpenAI e Anthropic estão em concorrência direta com avanços focados em codificação e agentes de longa duração: OpenAI lançou o GPT‑5.3 Codeex logo após Opus 4.6, e ambos investem em coding e agentes/subagentes. Codeex recebeu ganhos de velocidade não por inferência mais rápida, mas por gerar resultados com muito menos tokens (ex.: 43.000 vs 91.000), além de aumento de acurácia em benchmarks. A equipe afirma que versões anteriores do modelo foram instrumentais na criação da versão 5.3, evidenciando um processo de auto‑melhoria assistida por prompts humanos para debugar, testar e gerenciar deploy. GPT‑5.3 Codeex agora consegue ser dirigido mid‑task, entende intenções pouco especificadas e realiza tarefas de desenvolvimento web e trabalho cognitivo comparáveis a profissionais, demonstradas em exemplos autônomos que geraram dois jogos (corrida e mergulho) e landing pages estéticas melhores que 5.2. Claude (Anthropic) destaca‑se em manipulação de arquivos e tarefas de conhecimento (PDFs, Excel, PowerPoint) com o Claude Co‑Work, enquanto ferramentas de revisão de código como Grapile são recomendadas para validar e atribuir confiança ao código gerado em pipelines de alta velocidade. Além disso, 5.3 melhora apresentação de preços e escolhas por padrão, facilita revisão iterativa e sinaliza potencial para automação de fluxos profissionais complexos ainda em breve.