Google Antigravity vs Claude Code vs Codex: O Teste Real
Desvendando o melhor: Google Antigravity, Claude Code ou Codex?
Conteudo
TLDR;
Antigravity (Google) é o mais rápido e autônomo; Claude Code (Anthropic) é mais cuidadoso e controlável; Codex (OpenAI) opera isolado em um sandbox na nuvem e devolve PRs prontos. A escolha depende do seu estilo de trabalho: use Antigravity para delegar e orquestrar, Claude Code para co-pilotagem com inspeção contínua e Codex para um fluxo hands‑off que entrega resultados. Apesar de Flash ter preço por token menor e Opus custar mais por token, Flash gera muito mais saída e na prática os custos convergem, com planos topo girando em torno de US$200 por mês.
Resumo
O vídeo compara três ferramentas de desenvolvimento guiadas por IA — Anti‑gravity (Google/Gemini 3.5 Flash), Claude Code (Anthropic/Opus 4.7) e Codex (OpenAI/GPT‑5.5 em sandbox) — que têm a mesma interface externa (uma caixa de prompt, painel de status e visualizador de diff) mas cerebros completamente diferentes: Flash é absurdamente rápido (>280 tokens/s), gera muitos sub‑agentes e prioriza velocidade e autonomia; Opus é mais lento, “pensa” mais por token e segue regras de projeto de forma literal, obtendo melhor desempenho em benchmarks multi‑arquivo (SWE Bench Pro: Opus 64% vs Flash 55%); Codex opera em uma VM remota, é menos visível e entrega PRs prontos. Em custo, Flash parece mais barato por token (US$1,50 entrada / US$9 saída) contra Opus (US$5 / US$25), mas gera ~3x mais tokens por tarefa por usar um grande budget de avaliação (73M), fazendo os preços convergirem; planos topo ficam em torno de US$200/mês. Cada ferramenta exige um papel humano distinto: gerente/orquestrador (Anti‑gravity), co‑piloto com muitos pontos de interceptação (Claude), ou operador que recebe resultados prontos (Codex). A recomendação final: não julgue pela tela — teste com o refactor mais bagunçado do seu backlog para ver “como” cada uma pensa, não apenas como aparenta.