CLI vs MCP: How AI Agents Choose the Right Tool for the Job
CLI ou MCP: qual é a ferramenta certa para inteligência artificial?
Conteudo
TLDR;
CLI é o uso direto de comandos de terminal (por exemplo ls, cat, grep, git, curl) que modelos já conhecem, enquanto MCP é um protocolo padrão onde servidores expõem ferramentas nomeadas com descrições e schemas JSON carregados no contexto. CLI é melhor para tarefas diretas e composáveis por pipes como operações de arquivo, Git e processamento de texto por ser mais compacto, e MCP é melhor quando é preciso ir além do terminal — por exemplo renderizar JavaScript, gerenciar autenticação, controle de acesso e auditoria. Na prática use os dois: peça ao agente para escolher CLI quando comandos mapearem diretamente ao trabalho e MCP quando a abstração, segurança ou governança justificarem o custo de tokens e complexidade.
Resumo
O texto compara duas formas de agentes de IA interagirem com o mundo externo: CLI (interface de linha de comando) e MCP (Model Context Protocol). CLI permite que o agente rode comandos de terminal como cat, grep, curl e git, aproveitando conhecimentos já presentes no treinamento dos modelos; é compacto, eficiente para operações locais, composição via pipes e barato em tokens. MCP define servidores que expõem ferramentas nomeadas com descrição e esquema JSON, oferecendo abstração, gerenciamento de autenticação, controle por usuário e trilhas de auditoria; porém carregar todos os schemas consome muitos tokens e pode inflacionar custos e limitar espaço de contexto. Exemplos mostram tarefas simples de arquivos em que ambos funcionam, operações Git onde MCP injeta dezenas de milhares de tokens desnecessários, e busca de páginas web onde MCP (um servidor com browser headless) venceu facilmente enquanto CLI teve de contornar JavaScript e gastar tempo e tokens. Conclusão: não é escolha exclusiva — usar CLI quando comandos mapeiam bem para a tarefa e MCP quando abstração, autenticação e governança são necessários; a combinação equilibrada, decidida pelo agente ou prompt, é a melhor abordagem. Se o agente começar a reverter frameworks JavaScript para acessar páginas, é sinal de escolha errada.