SLA- & SLO-Uptime-Berichte

Was SLA-/SLO-Berichte sind

Die Seite SLA-/SLO-Berichte übersetzt die Rohergebnisse Ihrer Monitore in die Sprache, die für Ihr Unternehmen und Ihre Kunden zählt: Uptime gegenüber einem Ziel. Für jeden Monitor legen Sie ein SLO-Ziel fest (zum Beispiel 99,9%), und LoadFocus zeigt Ihnen, ob Sie es erreichen, wie viel von Ihrem Error-Budget noch übrig ist, alarmiert Sie, wenn ein Ziel verletzt wird, und versendet einen wiederkehrenden SLA-Bericht per E-Mail an Ihr Team.

SLA-/SLO-Berichte sind eine kostenpflichtige Funktion. Im kostenlosen Tarif lädt die Seite Sie zum Upgrade ein.

Öffnen Sie sie über SLA-Berichte in der Seitenleiste oder rufen Sie /sla auf.

Die Berichtstabelle

Jede Zeile steht für einen Monitor (eine API-Prüfung) oder eine Prüfungsgruppe, ausgewertet über das Zeitfenster, das Sie oben rechts auswählen.

Monitor — die API-Prüfung oder Prüfungsgruppe, über die diese Zeile berichtet. Gruppenzeilen zeigen die Anzahl der enthaltenen Prüfungen in Klammern an.
Uptime — der zeitgewichtete Prozentsatz erfolgreicher Prüfungen über das ausgewählte Fenster. Eine Prüfung, die innerhalb eines 30-Tage-Fensters für eine Stunde ausgefallen war, senkt die Uptime im Verhältnis zu dieser Stunde. Wenn im Fenster keine Ergebnisse vorliegen, zeigt die Uptime einen Gedankenstrich (—) an.
SLO-Ziel % — Ihr Uptime-Ziel für diesen Monitor, zum Beispiel 99.9. Geben Sie einen Wert ein, um es festzulegen; alles andere in der Zeile (Error-Budget, Status, Verletzungsalarme) wird an diesem Ziel gemessen. Lassen Sie es leer, um die SLO-Verfolgung für diesen Monitor zu beenden.
Error-Budget — wie viel Ihrer zulässigen Ausfallzeit im Fenster bereits verbraucht wurde. Wenn Ihr Ziel 99,9% über 30 Tage beträgt, liegt Ihr Budget bei etwa 43 Minuten Ausfallzeit; der Balken füllt sich, während dieses Budget aufgebraucht wird. 0% bedeutet, dass nichts verbraucht wurde, 100% bedeutet, dass das Budget erschöpft ist (und das SLO verletzt ist).
Status — ein schnelles Urteil für das Fenster: OK (Ziel erreicht), Breached (Error-Budget erschöpft) oder No data (keine Ergebnisse im Fenster).

Wie Uptime und Error-Budget berechnet werden

Die Uptime ist zeitgewichtet: Jedes Ergebnis zählt für die Zeit bis zum nächsten Ergebnis, sodass ein kurzer Ausfall bei einer 1-Minuten-Prüfung und derselbe Ausfall bei einer 5-Minuten-Prüfung die Uptime konsistent beeinflussen. Das Error-Budget entspricht einer Ausfallzeit von 100% − target; der verbrauchte Prozentsatz ist der Anteil dieses Spielraums, der im Fenster bereits aufgebraucht wurde.

Verletzungsalarme

Die Spalte Breach Alert ermöglicht es jedem Monitor, Sie in dem Moment zu benachrichtigen, in dem er sein SLO zu verfehlen droht, ohne dass Sie die Seite beobachten müssen.

Alert on breach — aktivieren Sie diese Option, um Verletzungsalarme für das SLO dieses Monitors einzuschalten.
Budget consumed % — der Schwellenwert, bei dem der Alarm ausgelöst wird. 100 bedeutet "erst alarmieren, wenn das gesamte Error-Budget aufgebraucht ist"; ein niedrigerer Wert (zum Beispiel 80) warnt Sie früher, solange Sie noch Budget zum Reagieren übrig haben.
Window — der gleitende Zeitraum, über den das Budget für die Alarmierung ausgewertet wird: 24h, 7d oder 30d.

Verletzungsalarme werden an die eigenen Alarmkanäle der Prüfung weitergeleitet (dieselben E-Mail-, Slack-, PagerDuty-, Opsgenie-, Discord- oder Webhook-Kanäle, die Sie für die Prüfung konfiguriert haben) unter einem dedizierten slaBreaches-Ereignis, sodass sie unabhängig von Up/Down- und SSL-Alarmen sind. Sie erhalten außerdem eine Wiederherstellungsbenachrichtigung, wenn der Monitor wieder über sein Ziel steigt. Unter Alarmkanäle erfahren Sie, wie Sie festlegen, wohin Alarme gesendet werden.

Zeitfenster und Export

Zeitfenster (Auswahl oben rechts) — der Berichtszeitraum, der für jede Zeile verwendet wird: Last 24h, Last 7 days, Last 30 days oder This month (der aktuelle Kalendermonat). Alle Zeiträume werden in UTC berechnet.
Export CSV — laden Sie die aktuelle Tabelle (Uptime, SLO-Ziel, Error-Budget und Status für jeden Monitor) als CSV-Datei herunter, bereit für eine Tabellenkalkulation oder eine kundenorientierte SLA-Prüfung.

Geplante SLA-Berichte

Unterhalb der Tabelle versendet Scheduled SLA Report eine wiederkehrende Zusammenfassung per E-Mail an Ihr Team, sodass niemand das Dashboard öffnen muss.

Enable — automatische SLA-Berichte ein- oder ausschalten.
Cadence — wie oft der Bericht gesendet wird: Weekly oder Monthly. Ein Bericht deckt immer den zuletzt abgeschlossenen Zeitraum ab (letzte Woche oder letzter Monat), niemals einen Zeitraum, der noch läuft.
Timezone — die Zeitzone, die zur Bestimmung der Zeitraumgrenzen und der Versandzeit verwendet wird, zum Beispiel UTC oder Europe/London.
Recipients (team members) — wer den Bericht erhält. Es können nur Mitglieder Ihres Teams ausgewählt werden, was den Bericht innerhalb Ihrer Organisation hält und jedem Empfänger eine Möglichkeit zum Abbestellen bietet.

Jede geplante E-Mail listet die Monitore auf, ihre Uptime gegenüber dem Ziel für den Zeitraum sowie die Anzahl der verletzten SLOs, mit einem Link zurück zu dieser Seite.

Hinweise

Alle Fenster und Berichtszeiträume werden in UTC ausgewertet.
Eine Zeile, die No data anzeigt, hat keine Prüfungsergebnisse im ausgewählten Fenster — vergewissern Sie sich, dass der Monitor tatsächlich läuft und nicht nur gespeichert ist (siehe API-Prüfungsergebnisse verstehen).
SLO-Ziele, Verletzungsalarm-Einstellungen und Berichtseinstellungen werden gespeichert, sobald Sie sie ändern.