אחזור שמנמק, מאמת ופועל
מעבר לחיפוש פשוט. Agentic RAG משלב שליפה מרובה הופ עם דירוג מחדש, אימות וביצוע כלים כך שכל תשובה ניתנת להגנה וכל פעולה ניתנת לביקורת.
ה-RAG המסורתי מחזיר את הנתחים המתאימים ביותר ומקווה שמודל שפה יסדר את זה. Agentic RAG עוטף את הצעד הזה בלולאה: הוא מתכנן את השליפה, בודק תוצאות מול חוקים עסקיים, חוצה הקשר קשור כאשר מתגלים פערים, ורק אז מבצע תשובה או פעולה.
איך זורמת שאילתה בודדת
- 01
תכננו את השליפה
מתזמר מפרק את כוונת המשתמש לשאילתות משנה, בוחר את הרטריבר הנכון (וקטור, BM25, גרף או SQL), ומתזמן אותן במקביל.
- 02
אחזר ודירוג מחדש
דירוג מחדש של המקודדים במועמדים המובילים מעלה את הדיוק ב-10-20% לעומת חיפוש דמיון טהור. מועמדים בעלי ביטחון נמוך מפעילים קפיצת אחזור שנייה באופן אוטומטי.
- 03
אמת ופעל
שרשרת אימות בודקת ציטוטים, כללים עסקיים ואילוצי מדיניות לפני שתחזור תגובה. כאשר מותר, הסוכן משלים את הפעולה - עדכון כרטיס, הפעלת שיחת API - במקום להחזיר את העבודה לאדם.
מה נשלח מהקופסה
שליפה מרובה הופ
עוקב אחר קישורים בין מסמכים וצמתים של גרפי ידע כדי לענות על שאלות המשתרעות על פני מספר מקורות, מבלי לנפח הנחיות עם הקשר לא רלוונטי.
דירוג מחדש של המקודדים
מדרג מחדש ייעודי מדרג כל מועמד מול השאילתה המקורית, ומעלה את הדיוק כאשר תשובות משוערות אינן מקובלות.
יציאות ראשונות לציטוט
ניתן לעקוב אחר כל טענה למקור שלה - ציטוטים ניתנים ללחיצה, ייחוס ברמת הטווח וציוני אמון בכל תגובה.
הסלמה של אדם בתוך הלופ
כאשר הביטחון נופל מתחת לסף, הצינור מפנה לאדם עם עקבות ההיגיון המלאים - לא שאלה חשופה.