Cada agente de IA que usa MCP está pagando caro demais. Não nas próprias chamadas de API – tudo bem. O imposto está no manual de instruções.
Antes que seu agente possa fazer algo útil, ele precisa saber quais ferramentas estão disponíveis. A resposta do MCP é despejar todo o catálogo de ferramentas na conversa como esquema JSON. Cada ferramenta, cada parâmetro, cada opção.
CLI faz o mesmo trabalho, mas mais barato.
Peguei um servidor MCP e gerei uma CLI usando CLIHub. Mesmas ferramentas, mesmo OAuth, mesma API por baixo. Duas coisas mudam: o que é carregado no início da sessão e como o agente chama uma ferramenta.
Os números abaixo pressupõem uma configuração típica: 6 servidores MCP, 14 ferramentas cada, 84 ferramentas no total.
1. Início da sessão
O MCP despeja todos os esquemas de ferramentas na conversa antecipadamente. A CLI usa uma lista leve de habilidades – apenas nomes e locais. O agente descobre detalhes quando precisa deles.1
{
"name": "notion-search",
"description": "Search for pages and databases",
"inputSchema": {
"type": "object",
"properties": {
"query": {
"type": "string",
"description": "The search query text"
},
"filter": {
"type": "object",
"properties": {
"property": { "type": "string", "enum": ["object"] },
"value": { "type": "string", "enum": ["page", "database"] }
}
}
}
},
{
"name": "notion-fetch",
...
}
... (84 tools total)
}
notion
CLI for Notion
~/bin/notion
linear
...
... (6 tools total)
2. Chamada de ferramenta
Depois que o agente souber o que está disponível, ele ainda precisará chamar uma ferramenta.
{
"tool_call": {
"name": "notion-search",
"arguments": {
"query": "my search"
}
}
}# Step 1: Discover tools (~4 + ~600 tokens)
$ notion --help
notion search [--filter-property ...]
Search for pages and databases
notion create-page [--parent-id ID]
Create a new page
... 12 more tools
------------------------------------------------
# Step 2: Execute (~6 tokens)
$ notion search "my search" A chamada do MCP é mais barata porque as definições são pré-carregadas. CLI paga no momento da descoberta – --help retorna a referência completa do comando (~600 tokens para 14 ferramentas), então o agente sabe o que executar.
| Ferramentas usadas | PCM | CLI | Poupança |
|---|---|---|---|
| Início da sessão | ~15.540 | ~300 | 98% |
| 1 ferramenta | ~15.570 | ~910 | 94% |
| 10 ferramentas | ~15.840 | ~964 | 94% |
| 100 ferramentas | ~18.540 | ~1.504 | 92% |
A CLI usa cerca de 94% menos tokens em geral.
A Anthropic lançou o Tool Search, que carrega um índice de pesquisa em vez de cada esquema e depois usa ferramentas de busca sob demanda. Normalmente reduz o uso de tokens em 85%.
Mesma ideia do carregamento lento da CLI. Mas quando o Tool Search busca uma ferramenta, ele ainda extrai o esquema JSON completo.2
| Ferramentas usadas | PCM | TS | CLI | Poupança vs TS |
|---|---|---|---|---|
| Início da sessão | ~15.540 | ~500 | ~300 | 40% |
| 1 ferramenta | ~15.570 | ~3.530 | ~910 | 74% |
| 10 ferramentas | ~15.840 | ~3.800 | ~964 | 75% |
| 100 ferramentas | ~18.540 | ~12.500 | ~1.504 | 88% |
O Tool Search é mais caro e é apenas antrópico. CLI é mais barato e funciona com qualquer modelo.
CLI Hub
Tive dificuldade em encontrar CLIs para muitas ferramentas, então criei o CLIHub, um diretório de CLIs para uso do agente.
Código aberto do conversor – um comando para criar CLIs a partir de MCPs.
Fonte: theverge

