Recuperação que raciocina, verifica e age
Para além da simples pesquisa. O Agentic RAG combina a recuperação multi-hop com a reclassificação, verificação e execução de ferramentas para que cada resposta seja defensável e cada ação seja auditável.
O RAG tradicional devolve os pedaços mais adequados e espera que um modelo de linguagem resolva isso. O Agentic RAG envolve esta etapa num loop: planeia a recuperação, verifica os resultados em relação às regras de negócio, percorre o contexto relacionado quando são detetadas lacunas e só depois confirma uma resposta ou ação.
Como uma única consulta flui
- 01
Planeie a recuperação
Um orquestrador decompõe a intenção do utilizador em subconsultas, escolhe o recuperador correto (vetor, BM25, gráfico ou SQL) e agenda-os em paralelo.
- 02
Recuperar e reclassificar
A reclassificação dos codificadores cruzados nos principais candidatos aumenta a precisão em 10–20% em relação à pesquisa por pura similaridade. Os candidatos de baixa confiança desencadeiam um segundo salto de recuperação automaticamente.
- 03
Verifique e aja
Uma cadeia de verificação verifica as citações, as regras de negócio e as restrições políticas antes de uma resposta ser devolvida. Quando permitido, o agente conclui a ação – atualizando um ticket, executando uma chamada API – em vez de devolver o trabalho a um ser humano.
O que sai da caixa
Recuperação multi-hop
Segue ligações entre documentos e nós do grafo de conhecimento para responder a questões que abrangem diversas fontes, sem pedidos excessivos com contexto irrelevante.
Reclassificação de codificador cruzado
Um reclassificador dedicado pontua cada candidato em relação à consulta original, aumentando a precisão onde as respostas aproximadas não são aceitáveis.
Resultados com citação inicial
Cada afirmação é rastreável até à sua fonte: citações clicáveis, atribuição ao nível da extensão e pontuações de confiança em cada resposta.
Escalação humana
Quando a confiança cai abaixo do limiar, o pipeline é direcionado para um ser humano com o rastreio de raciocínio completo anexado – e não uma simples pergunta.