Recuperare care motivează, verifică și acționează
Dincolo de simpla căutare. Agentic RAG combină regăsirea multi-hop cu reclasificarea, verificarea și execuția instrumentului, astfel încât fiecare răspuns poate fi susținut și fiecare acțiune poate fi auditată.
RAG tradițional returnează cele mai bune bucăți și speră ca un model de limbă să le rezolve. Agentic RAG cuprinde acest pas într-o buclă: planifică recuperarea, verifică rezultatele în raport cu regulile de afaceri, traversează contextul aferent atunci când sunt detectate lacune și abia apoi comite un răspuns sau o acțiune.
Cum curge o singură interogare
- 01
Planificați recuperarea
Un orchestrator descompune intenția utilizatorului în sub-interogări, alege retrieverul potrivit (vector, BM25, grafic sau SQL) și le programează în paralel.
- 02
Recuperează și reclasifică
Reclasificarea cu codificatori încrucișați pe candidații de top crește precizia cu 10-20% față de căutarea de similaritate pură. Candidații cu încredere scăzută declanșează automat un al doilea hop de recuperare.
- 03
Verificați și acționați
Un lanț de verificare verifică citările, regulile de afaceri și constrângerile de politică înainte de a reveni un răspuns. Când este permis, agentul finalizează acțiunea - actualizarea unui bilet, rularea unui apel API - în loc să predea munca înapoi unui om.
Ceea ce este livrat din cutie
Recuperare multi-hop
Urmează legăturile dintre documente și nodurile grafice de cunoștințe pentru a răspunde la întrebări care acoperă mai multe surse, fără solicitări de balonare cu context irelevant.
Reclasificare cross-encoder
Un evaluator dedicat punctează fiecare candidat în raport cu interogarea inițială, ridicând precizia acolo unde răspunsurile aproximative nu sunt acceptabile.
Citare-primul output
Fiecare revendicare poate fi urmărită până la sursă - citări pe care se poate face clic, atribuire la nivel de interval și scoruri de încredere pentru fiecare răspuns.
Escalarea umană în buclă
Când încrederea scade sub pragul, conducta se îndreaptă către un om cu următorul raționament complet atașat - nu o întrebare simplă.