Echter Verkehr, sichere Ausführung
Die Sandbox spielt historische Tickets, Rechnungen und Anfragen ab — Agenten üben an echten Daten, ohne echte Systeme zu berühren.
Unit-Tests fangen Regressionen in reinen Funktionen ab. Agenten scheitern am Long Tail realer Eingaben, an die niemand gedacht hat. Die Sandbox ist der Ort, an dem dieser Tail getestet wird: sicher, abspielbar und teilbar.
Wie Replay funktioniert
- 01
Echten Verkehr erfassen
Produktionsanfragen werden mit Eingaben, Systemzustand und Ergebnissen erfasst — automatisch, kontinuierlich.
- 02
Isoliert replayen
Die Sandbox spielt erfasste Arbeit gegen neue Agentenversionen in einer abgeschotteten Umgebung ab. Keine echten Tickets werden berührt.
- 03
Vergleichen und ausliefern
Unterschiede zwischen alten und neuen Ergebnissen werden zur Prüfung herausgestellt. Regressionen blockieren das Deploy.
Fähigkeiten
Deterministische Seeds
Replays sind reproduzierbar — gleiche Eingabe, gleiche Ausgabe — sodass Bugs debuggbar sind, nicht nach Gefühl.
Redaction als Standard
Sensible Felder werden vor dem Replay redigiert. Tester arbeiten auf realistischen Daten ohne PII-Fußabdruck.
Canary-Populationen
Replay gegen einen Verkehrsausschnitt (nach Tenant, Kategorie oder Segment), um Risiken vor dem vollständigen Rollout abzuschätzen.
Regressionskorpus
Vergangene Bugs werden zu hartnäckigen Regressionsfällen. Fixes bleiben fix.