← Status-Page

Eskalations-Doktrin.

Wenn etwas nicht läuft, wollen Sie nicht raten, was wir gerade tun. Diese Seite beschreibt das 4-Stufen-Spielbuch, das wir bei jeder Störung abfahren, von der Detektion bis zum Post-Mortem.

T+0

Detektion und Erst-Notification

Zabbix oder Wazuh oder ein Kunden-Ticket triggert die Eskalations-Kette. Die Status-Page wird automatisch auf "Eingeschränkter Betrieb" oder "Störung" gesetzt, abhängig vom Schweregrad.

  • Status-Page-Update binnen 60 Sekunden
  • Interner Incident-Channel automatisch eröffnet (Teams)
  • On-Call-Engineer automatisch alarmiert
T+5

Erste Diagnose und Kunden-Kommunikation

Spätestens 5 Minuten nach Detektion stehen die ersten Diagnose-Daten zur Verfügung. Wenn der Vorfall Kunden direkt betrifft, geht eine personalisierte Mail an die im Vertrag dokumentierten Eskalations-Adressen.

  • Kurze Beschreibung was betroffen ist
  • Erste Einschätzung zur Dauer (wenn möglich)
  • Status-Page-Update mit Detail-Beschreibung
  • Auf Wunsch: Telefon-Anruf an primäre Ansprechperson
T+30

Update-Pflicht und Eskalations-Pfad

Wenn der Vorfall nach 30 Minuten nicht resolved ist, kommt das nächste Update mit verbindlicher Status-Information. Disaster-Trigger in Zabbix sorgt dafür, dass diese Frist nicht vergessen werden kann.

  • Verbindliches Status-Update auf Status-Page
  • Zweite Mail an Eskalations-Adressen
  • Falls nötig: Zweiten Engineer eskaliert (Backup-Pfad)
  • Workaround-Optionen werden kommuniziert wenn vorhanden
T+resolved

Auflösung, Post-Mortem und Nachsorge

Nach Resolution wird die Status-Page sofort auf "Operativ" zurückgesetzt. Innerhalb von 48 Stunden erhalten Mandats- und Vollstack-Kunden ein schriftliches Post-Mortem mit Root-Cause-Analyse und Massnahmen.

  • Status-Page-Reset auf "Operativ"
  • Resolution-Notification an Kunden
  • Post-Mortem binnen 48h für Mandats-Kunden
  • Präventive Massnahmen werden in /engineering dokumentiert
Vertraglich

Eskalations-Pfade sind im SLA dokumentiert.

Welche Adressen wir alarmieren, welche Telefonnummer wir anrufen, welche Reaktionszeiten gelten, alles steht in Ihrem Service-Level-Agreement. Wir improvisieren nicht.

Zur Status-Page →Sicherheit und Datenschutz →