Google Gemma 4 Tutorial - Run AI Locally for Free
Google Gemma 4: execute inteligência artificial localmente de graça com o tutorial do Teacher's Tech.
Conteudo
TLDR;
É possível rodar o Gemma 4 localmente e gratuitamente, sem internet e com seus dados permanecendo no seu computador após baixar o modelo. Você pode testar sem instalar acessando o Google AI Studio (studio.google.com) com uma conta Google e selecionando Gemma no navegador. Há variantes E2B/E4B para aparelhos com poucos recursos (E2B roda com ~5 GB de RAM), 26B requer ~16–20 GB (usa mixture of experts) e 31B pede ≥20 GB ou GPU, sendo E4B ou o modelo padrão (~8 GB) recomendados para a maioria.
Resumo
Gemma 4 é uma família de modelos de IA da Google projetada para rodar localmente no seu computador — até em laptops ou Raspberry Pi — oferecendo privacidade (nenhum dado sai da máquina), uso gratuito e sem limite de API ou assinatura. É uma versão portátil do Gemini e vem em quatro tamanhos: E2B e E4B (para dispositivos com recursos limitados; E2B pode rodar com ~5 GB de RAM), 26B (modelo Mixture of Experts, aconselhável em desktops com ~16–20 GB de RAM) e 31B (flagship, recomenda‑se ≥20 GB ou GPU dedicada). Gemma 4 é multimodal: texto, imagens (e os menores podem processar áudio). Dá para testar no navegador via Google AI Studio com conta Google, sem instalar nada, ou rodar localmente com a ferramenta Olama (download para Windows/Mac/Linux, depois "olama pull" para baixar o modelo). Em testes, gera respostas bem estruturadas — explicações, e‑mails, leitura de recibos por imagem, código HTML funcional e raciocínio matemático/otimizações — com velocidade dependente do hardware (GPU acelera; mesmo CPU funciona). Para a maioria, recomenda‑se começar pelo E4B para ter uma experiência representativa sem exigir muito da máquina. Usuários avançados podem escolher o 31B, ajustar parâmetros locais e gerenciar armazenamento para preferência e desempenho adequado.