Des agents qui contrôlent leur propre travail avant livraison
Le schéma loop-and-verify exécute planifier → agir → vérifier → valider à chaque tâche. Les erreurs sont détectées à l'intérieur de la boucle, et non en aval par un humain.
La plupart des systèmes d'IA répondent et passent à autre chose. Les agents autonomes doivent travailler comme des ingénieurs seniors : planifier le changement, l'exécuter, en tester le résultat, puis seulement le valider. L'architecture loop-and-verify est la discipline imposée à chaque étape.
Au cœur de la boucle
- 01
Planifier
L'agent décompose la requête de l'utilisateur en sous-tâches concrètes, sélectionne les outils et esquisse le résultat attendu pour que la réussite soit mesurable.
- 02
Agir
L'agent exécute chaque sous-tâche, appelle des API et écrit l'état. Chaque appel d'outil est consigné avec ses entrées, ses sorties et sa durée.
- 03
Vérifier et valider
Avant que le changement ne soit pérennisé, l'agent rejoue son plan sur le nouvel état, contrôle les garde-fous et valide ou restaure avec un motif.
Pourquoi la boucle est essentielle
Auto-correction
Lorsque la vérification échoue, l'agent affine son plan et réessaie — sans solliciter un humain pour les manquements courants.
Évaluations déterministes
Chaque boucle produit une trace reproductible rejouable hors ligne, rendant les tests de non-régression praticables.
Application des garde-fous
Les contrôles de politique s'exécutent au moment de la vérification, afin qu'aucune action destructrice n'atteigne la production sous prétexte que le plan paraissait solide.
Réessais peu coûteux
Les vérifications échouées sont gratuites comparées aux déploiements ratés. Les coûts s'accumulent dans le bon sens.