Rapports de disponibilité SLA & SLO

Ce que sont les rapports SLA / SLO

La page Rapports SLA / SLO traduit les résultats bruts de vos moniteurs dans le langage qui compte pour votre entreprise et vos clients : la disponibilité par rapport à un objectif. Pour chaque moniteur, vous définissez un objectif SLO (par exemple 99.9%), et LoadFocus vous indique si vous le respectez, combien il reste de votre budget d'erreur, vous alerte lorsqu'un objectif est dépassé, et envoie par e-mail un rapport SLA récurrent à votre équipe.

Les rapports SLA / SLO sont une fonctionnalité payante. Sur le forfait gratuit, la page vous invite à passer à une offre supérieure.

Ouvrez-la depuis Rapports SLA dans la barre latérale, ou rendez-vous sur /sla.

Le tableau de rapport

Chaque ligne correspond à un moniteur (une vérification API) ou à un groupe de vérifications, évalué sur la fenêtre temporelle que vous sélectionnez en haut à droite.

  • Moniteur — la vérification API ou le groupe de vérifications sur lequel porte cette ligne. Les lignes de groupe affichent le nombre de vérifications membres entre parenthèses.
  • Disponibilité — le pourcentage pondéré dans le temps des vérifications réussies sur la fenêtre sélectionnée. Une vérification indisponible pendant une heure sur une fenêtre de 30 jours réduit la disponibilité proportionnellement à cette heure. Lorsqu'il n'y a aucun résultat dans la fenêtre, la disponibilité affiche un tiret ().
  • % d'objectif SLO — votre objectif de disponibilité pour ce moniteur, par exemple 99.9. Saisissez une valeur pour le définir ; tout le reste de la ligne (budget d'erreur, statut, alertes de dépassement) est mesuré par rapport à cet objectif. Laissez ce champ vide pour cesser de suivre un SLO pour ce moniteur.
  • Budget d'erreur — la part de votre temps d'indisponibilité autorisé qui a été consommée dans la fenêtre. Si votre objectif est de 99.9% sur 30 jours, votre budget correspond à environ 43 minutes d'indisponibilité ; la barre se remplit à mesure que ce budget est utilisé. 0% signifie aucune consommation, 100% signifie que le budget est épuisé (et que le SLO est dépassé).
  • Statut — un verdict rapide pour la fenêtre : OK (objectif respecté), Dépassé (budget d'erreur épuisé), ou Aucune donnée (aucun résultat dans la fenêtre).

Comment la disponibilité et le budget d'erreur sont calculés

La disponibilité est pondérée dans le temps : chaque résultat compte pour la durée jusqu'au résultat suivant, de sorte qu'une courte panne sur une vérification toutes les minutes et la même panne sur une vérification toutes les 5 minutes affectent la disponibilité de manière cohérente. Le budget d'erreur correspond à 100% − target de temps d'indisponibilité ; le pourcentage consommé est la part de cette tolérance déjà utilisée dans la fenêtre.

Alertes de dépassement

La colonne Alerte de dépassement permet à chaque moniteur de vous notifier dès qu'il est sur le point de manquer son SLO, sans que vous ayez à surveiller la page.

  • Alerter en cas de dépassement — activez cette option pour activer les alertes de dépassement de SLO pour ce moniteur.
  • % de budget consommé — le seuil à partir duquel l'alerte se déclenche. 100 signifie « alerter uniquement une fois la totalité du budget d'erreur consommée » ; une valeur plus basse (par exemple 80) vous avertit plus tôt, alors qu'il vous reste encore du budget pour réagir.
  • Fenêtre — la période glissante sur laquelle le budget est évalué pour les alertes : 24h, 7j, ou 30j.

Les alertes de dépassement sont acheminées vers les propres canaux d'alerte de la vérification (les mêmes canaux e-mail, Slack, PagerDuty, Opsgenie, Discord ou webhook que vous avez configurés pour la vérification) sous un événement slaBreaches dédié, de sorte qu'elles sont indépendantes des alertes de disponibilité et SSL. Vous recevez également une notification de rétablissement lorsque le moniteur repasse au-dessus de son objectif. Consultez Canaux d'alerte pour configurer où sont envoyées les alertes.

Fenêtre temporelle et export

  • Fenêtre temporelle (sélecteur en haut à droite) — la période de rapport utilisée pour chaque ligne : Dernières 24h, 7 derniers jours, 30 derniers jours, ou Ce mois-ci (le mois calendaire en cours). Toutes les périodes sont calculées en UTC.
  • Exporter CSV — téléchargez le tableau actuel (disponibilité, objectif SLO, budget d'erreur et statut pour chaque moniteur) sous forme de fichier CSV, prêt pour un tableur ou une revue SLA destinée à un client.

Rapports SLA planifiés

Sous le tableau, le Rapport SLA planifié envoie par e-mail un récapitulatif récurrent à votre équipe afin que personne n'ait à ouvrir le tableau de bord.

  • Activer — activez ou désactivez les rapports SLA automatiques.
  • Fréquence — la fréquence d'envoi du rapport : Hebdomadaire ou Mensuelle. Un rapport couvre toujours la période la plus récemment terminée (la semaine ou le mois dernier), jamais une période encore en cours.
  • Fuseau horaire — le fuseau horaire utilisé pour déterminer les limites de période et l'heure d'envoi, par exemple UTC ou Europe/London.
  • Destinataires (membres de l'équipe) — qui reçoit le rapport. Seuls les membres de votre équipe peuvent être sélectionnés, ce qui maintient le rapport au sein de votre organisation et donne à chaque destinataire la possibilité de se désinscrire.

Chaque e-mail planifié liste les moniteurs, leur disponibilité par rapport à l'objectif pour la période, et le nombre de SLO dépassés, avec un lien de retour vers cette page.

Remarques

  • Toutes les fenêtres et périodes de rapport sont évaluées en UTC.
  • Une ligne qui affiche Aucune donnée n'a aucun résultat de vérification dans la fenêtre sélectionnée — vérifiez que le moniteur est bien en cours d'exécution, et pas seulement enregistré (voir Comprendre les résultats des vérifications API).
  • Les objectifs SLO, les paramètres d'alerte de dépassement et les paramètres de rapport sont enregistrés à mesure que vous les modifiez.