Informes de disponibilidad SLA y SLO

Qué son los informes SLA / SLO

La página de Informes SLA / SLO convierte los resultados sin procesar de tus monitores en el lenguaje que importa a tu negocio y a tus clientes: la disponibilidad frente a un objetivo. Para cada monitor estableces un objetivo de SLO (por ejemplo, 99.9%) y LoadFocus te indica si lo estás cumpliendo, cuánto queda de tu presupuesto de error, te alerta cuando un objetivo se incumple y envía por correo un informe de SLA recurrente a tu equipo.

Los informes SLA / SLO son una función de pago. En el plan gratuito la página te invita a actualizar tu plan.

Ábrela desde SLA Reports en la barra lateral, o ve a /sla.

La tabla de informes

Cada fila representa un monitor (una comprobación de API) o un grupo de comprobaciones, evaluado durante la ventana temporal que selecciones en la parte superior derecha.

  • Monitor — la comprobación de API o el grupo de comprobaciones sobre el que informa esta fila. Las filas de grupo muestran entre paréntesis el número de comprobaciones que lo integran.
  • Disponibilidad — el porcentaje ponderado por tiempo de comprobaciones exitosas durante la ventana seleccionada. Una comprobación que estuvo caída durante una hora en una ventana de 30 días reduce la disponibilidad en proporción a esa hora. Cuando no hay resultados en la ventana, la disponibilidad muestra un guion ().
  • % objetivo de SLO — tu objetivo de disponibilidad para este monitor, por ejemplo 99.9. Escribe un valor para establecerlo; todo lo demás de la fila (presupuesto de error, estado, alertas de incumplimiento) se mide frente a este objetivo. Déjalo en blanco para dejar de monitorizar un SLO para ese monitor.
  • Presupuesto de error — cuánto de tu tiempo de inactividad permitido se ha consumido en la ventana. Si tu objetivo es 99.9% en 30 días, tu presupuesto es de aproximadamente 43 minutos de inactividad; la barra se llena a medida que se usa ese presupuesto. 0% significa que no se ha usado nada, 100% significa que el presupuesto se ha agotado (y el SLO se ha incumplido).
  • Estado — un veredicto rápido para la ventana: OK (cumpliendo el objetivo), Incumplido (presupuesto de error agotado) o Sin datos (sin resultados en la ventana).

Cómo se calculan la disponibilidad y el presupuesto de error

La disponibilidad está ponderada por tiempo: cada resultado cuenta por el tiempo transcurrido hasta el siguiente resultado, de modo que una breve interrupción en una comprobación de 1 minuto y la misma interrupción en una comprobación de 5 minutos afectan a la disponibilidad de forma coherente. El presupuesto de error equivale al tiempo de inactividad de 100% − objetivo; el porcentaje consumido es la parte de esa asignación que ya se ha gastado en la ventana.

Alertas de incumplimiento

La columna Alerta de incumplimiento permite que cada monitor te avise en el momento en que está a punto de no cumplir su SLO, sin que tengas que vigilar la página.

  • Alertar al incumplir — actívalo para habilitar las alertas de incumplimiento de SLO para este monitor.
  • % de presupuesto consumido — el umbral en el que se dispara la alerta. 100 significa "alertar solo cuando se haya agotado todo el presupuesto de error"; un valor más bajo (por ejemplo 80) te avisa antes, mientras aún te queda presupuesto para reaccionar.
  • Ventana — el periodo móvil sobre el que se evalúa el presupuesto para las alertas: 24h, 7d o 30d.

Las alertas de incumplimiento se enrutan a los propios canales de alerta de la comprobación (los mismos canales de email, Slack, PagerDuty, Opsgenie, Discord o webhook que configuraste para la comprobación) bajo un evento slaBreaches dedicado, de modo que son independientes de las alertas de caída/recuperación y de SSL. También recibirás una notificación de recuperación cuando el monitor vuelva a superar su objetivo. Consulta Canales de alerta para configurar a dónde van las alertas.

Ventana temporal y exportación

  • Ventana temporal (selector superior derecho) — el periodo de informe utilizado para cada fila: Últimas 24h, Últimos 7 días, Últimos 30 días o Este mes (el mes natural en curso). Todos los periodos se calculan en UTC.
  • Exportar CSV — descarga la tabla actual (disponibilidad, objetivo de SLO, presupuesto de error y estado de cada monitor) como un archivo CSV, listo para una hoja de cálculo o para una revisión de SLA de cara al cliente.

Informes de SLA programados

Debajo de la tabla, Informe de SLA programado envía por correo un resumen recurrente a tu equipo para que nadie tenga que abrir el panel.

  • Habilitar — activa o desactiva los informes de SLA automáticos.
  • Cadencia — con qué frecuencia se envía el informe: Semanal o Mensual. Un informe siempre cubre el periodo más reciente que se haya completado (la semana o el mes anterior), nunca un periodo aún en curso.
  • Zona horaria — la zona horaria utilizada para decidir los límites del periodo y la hora de envío, por ejemplo UTC o Europe/London.
  • Destinatarios (miembros del equipo) — quién recibe el informe. Solo se pueden seleccionar miembros de tu equipo, lo que mantiene el informe dentro de tu organización y ofrece a cada destinatario una forma de darse de baja.

Cada correo programado enumera los monitores, su disponibilidad frente al objetivo durante el periodo y cuántos SLO se incumplieron, con un enlace de vuelta a esta página.

Notas

  • Todas las ventanas y periodos de informe se evalúan en UTC.
  • Una fila que muestra Sin datos no tiene resultados de comprobación en la ventana seleccionada; confirma que el monitor realmente se está ejecutando y no solo guardado (consulta Comprender los resultados de las comprobaciones de API).
  • Los objetivos de SLO, los ajustes de alertas de incumplimiento y los ajustes de informes se guardan a medida que los modificas.