Il recupero che ragiona, verifica e agisce
Oltre la semplice ricerca. Agentic RAG combina il recupero multi-hop con la riclassificazione, la verifica e l'esecuzione dello strumento in modo che ogni risposta sia difendibile e ogni azione sia verificabile.
Il RAG tradizionale restituisce i pezzi con la migliore corrispondenza e spera che un modello linguistico risolva il problema. Agentic RAG racchiude questo passaggio in un ciclo: pianifica il recupero, controlla i risultati rispetto alle regole aziendali, attraversa il contesto correlato quando vengono rilevate lacune e solo allora esegue una risposta o un'azione.
Come scorre una singola query
- 01
Pianificare il recupero
Un orchestratore scompone l'intento dell'utente in sottoquery, sceglie il retriever corretto (vettore, BM25, grafico o SQL) e li pianifica in parallelo.
- 02
Recupera e riclassifica
La riclassificazione incrociata dei candidati migliori aumenta la precisione del 10-20% rispetto alla pura ricerca di somiglianza. I candidati con scarsa sicurezza attivano automaticamente un secondo hop di recupero.
- 03
Verificare e agire
Una catena di verifica controlla citazioni, regole aziendali e vincoli politici prima che venga restituita una risposta. Quando consentito, l'agente completa l'azione (aggiornamento di un ticket, esecuzione di una chiamata API) invece di restituire il lavoro a un essere umano.
Cosa è incluso
Recupero multi-hop
Segue i collegamenti tra documenti e nodi del grafico della conoscenza per rispondere a domande che abbracciano più fonti, senza gonfiare le richieste con un contesto irrilevante.
Reranking cross-encoder
Un reranker dedicato assegna un punteggio a ogni candidato rispetto alla query originale, aumentando la precisione laddove le risposte approssimative non sono accettabili.
Risultati della prima citazione
Ogni affermazione è riconducibile alla sua fonte: citazioni cliccabili, attribuzione a livello di intervallo e punteggi di affidabilità su ogni risposta.
Escalation human-in-the-loop
Quando la confidenza scende sotto soglia, la pipeline inoltra il caso a una persona con l'intera traccia del ragionamento allegata, non con una semplice domanda.