Incidenten, draaien op de automatische piloot totdat een mens moet beslissen
Wanneer een waarschuwing afgaat, voert de agent een triage uit, haalt telemetrie op, verwijst naar eerdere incidenten en stuurt het runbook aan - zodat mensen op een warm incident terechtkomen, niet op een koud incident.
De kosten van incidenten bestaan niet alleen uit de uitval; het is de menselijke tijd die verloren gaat aan het verzamelen van context. Agenten kunnen de verzameling (en de meeste bekende herstelstappen) binnen enkele seconden uitvoeren, zodat hulpverleners arriveren met een situatie die al is onderzocht.
De eerste vijf minuten van een incident
- 01
Triage en verrijken
Waarschuwingen worden ontdubbeld, gecorreleerd met recente wijzigingen en toegewezen aan een betrouwbaarheidsgewogen ernst.
- 02
Runbook-uitvoering
Voor bekende patronen stuurt de agent het runbook aan (rollbacks, schaling, failovers) met logboeken die aan het incident zijn gekoppeld.
- 03
Afgeven of oplossen
Opgeloste incidenten worden afgesloten met een postmortale stomp; onopgeloste problemen worden doorgegeven aan de wachtdienst met volledige context.
Mogelijkheden
Runbook-bibliotheek
Uw runbooks worden door agenten uitvoerbaar, met dry-run-modi voor niet-vertrouwde stromen.
Postmortale voorbereiding
Tijdlijn, diffs en getroffen oppervlakte worden voor elk incident automatisch samengesteld.
Schatting van de straalstraal
Agenten kwantificeren de reikwijdte (huurders, gebruikers, services) als onderdeel van triage.
Verander de correlatie
Recente implementaties, configuratiewijzigingen en vlagomkeringen worden vergeleken met waarschuwingsvensters.