Agentes que verificam o seu próprio trabalho antes de enviar
O padrão loop-and-verify executa planear → agir → verificar → confirmar em cada tarefa. Os erros são detetados dentro do loop, e não a jusante por um ser humano.
A maioria dos sistemas de IA responde e avança. Os agentes autónomos precisam de trabalhar como engenheiros seniores: planear a mudança, realizá-la, testar o resultado e só depois se comprometer. A arquitetura loop-and-verify é a forma como esta disciplina é aplicada em cada etapa.
Dentro do circuito
- 01
Plano
O agente decompõe o pedido do utilizador em subtarefas concretas, escolhe ferramentas e esboça o resultado esperado para que o sucesso seja mensurável.
- 02
Agir
O agente executa cada subtarefa, chamando APIs e escrevendo o estado. Cada chamada de ferramenta é capturada com as suas entradas, saídas e temporização.
- 03
Verifique e confirme
Antes de a alteração se tornar permanente, o agente reproduz o seu plano em relação ao novo estado, verifica as proteções e confirma ou reverte com um motivo.
Porque é que o loop é importante
Autocorreção
Quando a verificação falha, o agente refina o seu plano e tenta novamente, sem recorrer a um ser humano para erros de rotina.
Avaliações determinísticas
Cada ciclo produz um rastreio reproduzível que pode reproduzir offline, tornando prático o teste de regressão.
Aplicação de guarda-corpos
As verificações de políticas são executadas no momento da verificação, de modo a que as ações destrutivas nunca cheguem à produção apenas porque o plano parecia fiável.
Novas tentativas baratas
As verificações com falha são gratuitas em comparação com as implementações com falha. Os custos aumentam na direção certa.