DIVERA 24/7 Göttingen - Störung des Alarmservers – Details zu Vorfällen

System wird gewartet

Störung des Alarmservers

Gelöst
Großer Ausfall
Aufgetreten am vor fast 2 JahrenDauerte etwa 1 Stunde

Betroffen

Schnittstellen

Großer Ausfall aus 7:31 AM zu 8:54 AM

Alarmserver (E-Mail Auswertung)

Großer Ausfall aus 7:31 AM zu 8:54 AM

Aktualisierung
  • Update
    Update

    Die Skalierung von Systemkomponenten des Alarmservers war erfolgreich. Sie sind nun redundanter, sodass wir uns erhoffen, dass diese Art von Störung nicht mehr zu einem Ausfall der Alarmierung führt.

  • Gelöst
    Gelöst

    Die weiteren Funktionstests und Überprüfungen waren erfolgreich, und auch das Monitoring ist unauffällig.

    Die Ursache der Störung trat am 30.01. gegen 15:20 Uhr auf. Leider hat das Monitoring nicht gegriffen, weil die E-Mails zum Alarmserver weiter angenommen wurden, dahinterliegend eine Systemkomponente aber in einen Zustand geraten ist, in dem die E-Mails nicht weiterverarbeitet wurden.

    Diese Systemkomponente ist leider als eine der extrem wenigen bislang nicht ausreichend redundant ausgelegt.

    Wir konnten die Störung dann nach einer Meldung, um 08:44 Uhr beheben. Wir arbeiten daran, die hinter dem Alarmserver liegende Systemkomponente redundanter auszulegen. Hierzu werden wir kurzfristige Wartungsarbeiten durchführen, die keinen Einfluss auf die Systemverfügbarkeit haben.

     

  • Überprüfung
    Überprüfung

    Die Störung des Alarmservers konnte behoben werden, E-Mails werden jetzt wieder korrekt ausgewertet und lösen Alarmierungen aus.

    Wir führen nun weitere Funktionstests aus, und überwachen das System auf Auffälligkeiten.

  • Identifizierung
    Identifizierung

    Die Ursache wurde identifiziert, wir arbeiten an der Behebung des Problems.

  • Analyse
    Analyse

    Uns wurde gemeldet, dass der E-Mails über den Alarmserver nicht ausgewertet werden, und so Alarmierungen ausbleiben.