Agenten, die ihre Arbeit prüfen, bevor sie ausgeliefert wird
Das Loop-and-Verify-Muster durchläuft bei jeder Aufgabe Planen → Handeln → Verifizieren → Festschreiben. Fehler werden innerhalb der Schleife erkannt — nicht nachgelagert durch einen Menschen.
Die meisten KI-Systeme antworten und machen weiter. Autonome Agenten müssen wie erfahrene Ingenieure arbeiten: die Änderung planen, umsetzen, das Ergebnis testen und erst dann festschreiben. Die Loop-and-Verify-Architektur sorgt dafür, dass diese Disziplin bei jedem Schritt durchgesetzt wird.
Innerhalb der Schleife
- 01
Planen
Der Agent zerlegt die Anfrage in konkrete Teilaufgaben, wählt Werkzeuge aus und skizziert das erwartete Ergebnis — so wird Erfolg messbar.
- 02
Handeln
Der Agent führt jede Teilaufgabe aus, ruft APIs auf und schreibt Zustände. Jeder Werkzeugaufruf wird mit Eingaben, Ausgaben und Zeitangaben erfasst.
- 03
Verifizieren & festschreiben
Bevor die Änderung dauerhaft wird, spielt der Agent seinen Plan gegen den neuen Zustand ab, prüft Guardrails und schreibt entweder fest oder rollt mit Begründung zurück.
Warum die Schleife zählt
Selbstkorrektur
Schlägt die Verifikation fehl, verfeinert der Agent seinen Plan und versucht es erneut — ohne bei Routinefehlern einen Menschen einzubeziehen.
Deterministische Auswertungen
Jede Schleife erzeugt eine reproduzierbare Ablaufspur, die Sie offline abspielen können — Regressionstests werden dadurch praktikabel.
Guardrail-Durchsetzung
Richtlinienprüfungen laufen zur Verifikationszeit, sodass destruktive Aktionen die Produktion nicht allein deshalb erreichen, weil der Plan zuversichtlich wirkte.
Günstige Wiederholungen
Fehlgeschlagene Verifikationen sind im Vergleich zu fehlgeschlagenen Deployments kostenlos. Die Kosten wachsen in die richtige Richtung.