Arquitetura Multi-Agente com OpenClaw: Um Guia Prático
Como projetar e construir sistemas multi-agente usando sub-agentes OpenClaw. Cobre padrões de coordenação, seleção de modelo, tratamento de erros e exemplos reais de produção.
Arquitetura Multi-Agente com OpenClaw: Um Guia Prático
Agentes únicos de IA encontram paredes. Peça para um agente pesquisar um tópico, escrever um artigo, revisá-lo para precisão e publicá-lo — e quando chegar na metade da escrita, terá esquecido os detalhes da pesquisa. Janelas de contexto se enchem, foco se dispersa, qualidade cai.
Sistemas multi-agente resolvem isso dividindo trabalho entre agentes especializados, cada um com seu próprio contexto e instruções. Pense como uma pequena equipe: uma pessoa pesquisa, outra escreve, uma terceira revisa. Cada uma foca no que faz bem.
OpenClaw tem suporte nativo para isso através de sub-agentes. Aqui está como usá-los efetivamente.
Por Que Múltiplos Agentes?
Uma conversa de agente único tem limites práticos:
- Janela de contexto se enche. Após 50-80K tokens de conversa, o agente começa a perder rastro de detalhes anteriores. Pesquisa é esquecida, instruções se borram.
- Prompting generalista produz resultados medíocres. Um agente tentando ser pesquisador E escritor E editor é medíocre nos três.
- Sem paralelização. Um agente trabalha sequencialmente. Múltiplos agentes podem trabalhar simultaneamente.
- Debug é mais difícil. Quando algo dá errado em uma conversa de 200 mensagens, encontrar o ponto de falha leva uma eternidade. Com agentes separados, você sabe qual quebrou.
Padrões Fundamentais
Padrão 1: Coordenador + Trabalhadores
O padrão mais comum. Um agente principal delega tarefas para sub-agentes especializados.
Agente Principal (Coordenador)
├── Agente de Pesquisa — busca web, lê documentos
├── Agente de Escrita — produz conteúdo
├── Agente de Código — escreve e testa código
└── Agente de Revisão — verifica qualidade
O coordenador decide o que precisa ser feito, gera o trabalhador certo, espera resultados e decide o que acontece em seguida. Trabalhadores nunca conversam entre si diretamente — tudo flui através do coordenador.
É assim que sessions_spawn do OpenClaw funciona nativamente. Seu agente principal gera um sub-agente com tarefa específica, recebe o resultado e continua.
Padrão 2: Pipeline Sequencial
Agentes processam em ordem, cada um passando output para o próximo:
Entrada → Parser → Analisador → Gerador → Validador → Saída
Bom para fluxos estruturados onde cada passo constrói sobre o anterior. Pipelines de conteúdo, processamento de dados, fluxos de revisão de código.
O coordenador ainda orquestra, mas a lógica é mais simples — apenas rode agente A, pegue seu output, alimente agente B, e assim por diante.
Padrão 3: Enxame Paralelo
Múltiplos agentes abordam a mesma tarefa independentemente, então unem resultados:
Tarefa → [Agente A, Agente B, Agente C] → Unir → Saída
Funciona quando múltiplas perspectivas melhoram qualidade. Uso para pesquisa — três agentes buscam informação sobre o mesmo tópico usando abordagens diferentes, então um quarto agente sintetiza as descobertas. Captura coisas que qualquer agente único perderia.
Construindo Sub-Agentes no OpenClaw
Gerando um Sub-Agente
Da perspectiva do seu agente principal, gerar um sub-agente funciona assim:
// O agente principal chama sessions_spawn
sessions_spawn({
task: "Pesquise as 5 principais alternativas ao OpenClaw. Para cada uma, liste: nome, modelo de hospedagem, preços, funcionalidades principais e limitação principal. Retorne dados estruturados.",
model: "anthropic/claude-sonnet-4-20250514"
})
O sub-agente roda em sua própria sessão, faz seu trabalho e retorna o resultado para o agente principal.
Escolhendo Modelos por Agente
Nem todo agente precisa da mesma potência. Combine o modelo com a tarefa:
| Tipo de Tarefa | Modelo Recomendado | Por Que | |----------------|-------------------|---------| | Coleta simples de dados | Haiku | Rápido, barato, suficiente | | Escrita de conteúdo | Sonnet | Boa relação qualidade-custo | | Raciocínio complexo | Opus | Quando output do Sonnet não está cortando | | Geração de código | Sonnet | Lida bem com a maioria das tarefas de programação | | Revisão editorial | Sonnet ou Opus | Precisa capturar problemas sutis |
Especificando o modelo por sub-agente:
sessions_spawn({
task: "Escreva um tutorial de 2000 palavras sobre jobs cron do OpenClaw...",
model: "anthropic/claude-sonnet-4-20250514" // Sonnet para escrita
})
sessions_spawn({
task: "Revise este artigo para erros factuais e padrões de escrita de IA...",
model: "anthropic/claude-opus-4-6" // Opus para revisão cuidadosa
})
Isso mantém custos baixos. Usar Opus para tudo é como voar primeira classe em um voo de 30 minutos.
Passando Contexto Entre Agentes
Sub-agentes começam com contexto fresco. Não sabem sobre o que sua conversa principal tem sido. Você precisa passar contexto relevante explicitamente no prompt da tarefa.
Ruim:
"Agora escreva o artigo baseado na pesquisa que fizemos antes."
Bom:
"Escreva um tutorial de 2000 palavras sobre jobs cron do OpenClaw. Aqui está o contexto da pesquisa:
[colar resultados da pesquisa]
Palavra-chave alvo: 'tutorial jobs cron openclaw'
Tom: técnico, prático, específico
Inclua exemplos de código para: sintaxe básica de cron, verificação de email, agendamento de auditoria de segurança"
Quanto mais específico o prompt da tarefa, melhor o sub-agente funciona. Trate cada sub-agente como um novo contratado que conhece seu trabalho mas não conhece seu projeto ainda.
Tratamento de Erros
Sistemas multi-agente falham mais frequentemente que configurações de agente único porque há mais partes móveis. Construa recuperação no seu design.
Estratégia de Retry
Se sub-agente falhar:
1. Tente novamente com mesmo prompt (glitch de rede, limite de taxa)
2. Tente novamente com prompt simplificado (muito complexo para o modelo)
3. Tente novamente com modelo mais forte (Sonnet → Opus)
4. Desista e reporte a falha
Validação Entre Passos
Não confie cegamente no output do sub-agente. Valide antes de passar para o próximo passo:
- O agente de pesquisa retornou dados reais, ou alucinou fontes?
- O artigo escrito combina com a contagem de palavras solicitada?
- O código gerado é sintaticamente válido?
Um passo rápido de validação entre agentes captura problemas cedo.
Checkpointing
Salve resultados intermediários. Se o agente de escrita suceder mas o agente de revisão falhar, você não quer refazer a escrita.
# No seu workspace:
pipeline/
resultados-pesquisa.json # Após pesquisa
rascunho-v1.md # Após escrita
rascunho-humanizado.md # Após humanização
feedback-revisao.md # Após revisão
final.md # Versão publicada
Se o pipeline falhar no passo 4, você recomeça do passo 4 com o rascunho salvo, não do zero.
Gerenciamento de Timeout
Sub-agentes podem travar — loops infinitos, limites de taxa, modelo trava. Defina timeouts:
sessions_spawn({
task: "...",
runTimeoutSeconds: 300 // limite rígido de 5 minutos
})
Se um agente de pesquisa não retornou em 5 minutos, algo está errado. Mate-o e tente novamente.
Exemplo Real: Pipeline de Produção de Conteúdo
Aqui está o pipeline que realmente executo na MayaWorks. Cinco agentes, orquestrados por um coordenador:
Agente 1 — Pesquisador (Haiku) Busca por palavras-chave em tendência, verifica conteúdo existente, retorna lista priorizada de tópicos.
Agente 2 — Escritor (Sonnet) Pega um tópico e escreve um post de blog completo com frontmatter, exemplos de código e links internos.
Agente 3 — Humanizador (Sonnet) Remove padrões de escrita de IA — substitui "explorar" por "olhar", varia comprimento de sentenças, adiciona personalidade. Este passo faz diferença mensurável no engajamento do leitor.
Agente 4 — Revisor (Opus) Verifica precisão técnica, SEO básico, legibilidade e padrões de IA restantes. Retorna PASSAR, RETRABALHAR ou FALHAR com notas específicas.
Agente 5 — Publicador (Haiku) Salva o arquivo, comita no git, empurra para o repositório. Trabalho mecânico, modelo mais barato.
Tempo total de pipeline por post: 8-12 minutos. Custo total por post: cerca de $0,40-0,80 dependendo de revisões. São $4-8 para um lote de 10 posts.
Erros Comuns
Sobre-arquitetar. Não construa um enxame de 10 agentes para uma tarefa que um agente lida bem. Comece com um agente único. Quando bater em seus limites, divida o passo específico que está falhando.
Agentes conversando com agentes. No OpenClaw, sub-agentes reportam ao coordenador. Comunicação agente-para-agente adiciona complexidade sem benefício proporcional para a maioria dos casos de uso.
Ignorar custos. Cada chamada de sub-agente queima tokens. Um pipeline que gera 20 agentes por tarefa com preços nível-Opus custará $5+ por execução. Perfile seus custos cedo.
Sem logging. Quando o pipeline produz um post ruim, você precisa saber qual agente falhou. Salve o output de cada agente para debug.
Começando
- Comece com um agente único fazendo tudo
- Identifique qual passo consistentemente tem baixo desempenho
- Divida aquele passo em sub-agente dedicado com instruções focadas
- Adicione validação entre agentes
- Gradualmente divida mais passos conforme necessário
Você não precisa projetar toda a arquitetura antecipadamente. Deixe os problemas guiarem a estrutura.
Para a configuração técnica, comece com nosso guia de implantação VPS. Para ver um pipeline de conteúdo em ação, leia como construímos nosso pipeline de conteúdo. Navegue skills da comunidade no ClawHub para ferramentas de agente pré-construídas.