Qu'est-ce que le Network Monitoring ?

Le network monitoring observe en continu l'infrastructure connectant services et utilisateurs: liens, devices, packet loss, latence, jitter, BGP, DNS.

Qu'est-ce que le network monitoring ?

Le network monitoring est la discipline qui consiste à observer en continu la santé, la performance et le flux de trafic de l'infrastructure réseau qui connecte serveurs, services et utilisateurs. Il suit les devices (routeurs, switches, firewalls, load balancers, points d'accès), les liens (utilisation de bande passante, packet loss, latence, jitter) et les protocoles qui tournent par dessus (BGP, OSPF, DNS, TLS) pour qu'un opérateur détecte un lien dégradé, un uplink saturé ou une interface qui flap avant que les utilisateurs ne remarquent des page loads lentes ou des appels API qui échouent.

La sortie est généralement une vue topologique temps réel, des graphes de métriques par interface, des alertes de threshold sur des counters comme bandwidth ou error rate, et une flow database (NetFlow, sFlow, IPFIX) qui répond "quel trafic traversait ce lien à 14:32." Les outils du domaine incluent SolarWinds, PRTG, LibreNMS, Zabbix, Nagios, Cisco ThousandEyes, Kentik et Catchpoint.

Network monitoring vs infrastructure monitoring vs APM

Ces trois couches se chevauchent en outillage mais répondent à des questions différentes :

  • Network monitoring surveille les tuyaux : utilisation de lien, packet loss, changements de routage, temps de résolution DNS. Idéal pour diagnostiquer les plaintes "le réseau est lent."
  • Infrastructure monitoring surveille les hôtes : CPU, mémoire, disque, nombre de containers, métriques kernel. Idéal pour diagnostiquer "ce serveur est surchargé."
  • APM surveille l'application : latence par endpoint, requêtes lentes en base, error rate par chemin de code. Idéal pour diagnostiquer "le checkout est lent pour ce client."

Un stack opérationnel complet fait tourner les trois. Voir infrastructure monitoring et application performance monitoring pour les couches adjacentes.

Ce que couvre le network monitoring

  • Disponibilité : ICMP ping, SNMP up/down, checks de reachability de port à intervalles fixes.
  • Bandwidth et throughput : bytes par seconde par interface, peak vs average, utilisation percentile dans le temps.
  • Loss, latence, jitter : active probes (synthetic) ou analyse passive de flow ; les trois tueurs classiques du trafic temps réel.
  • Santé du routage et des protocoles : état de session BGP, changements de neighbor OSPF, événements MPLS LSP up/down.
  • Flow data : enregistrements NetFlow/sFlow/IPFIX par conversation, utilisés pour le capacity planning et la forensique de sécurité.
  • Configuration drift : snapshot des configs des devices, diff dans le temps, alerte quand un changement n'est pas autorisé.

Métriques clés du network monitoring

  1. Uptime et pourcentage d'availability : par device et par lien, agrégés à un SLA de service.
  2. Utilisation de bandwidth : pourcentage de capacité de lien utilisé, p95 sur la fenêtre de mesure.
  3. Pourcentage de packet loss : paquets droppés divisés par envoyés, observés par interface et par probe path.
  4. Latence (RTT) et jitter : round-trip time et sa variance, clés pour VoIP, vidéo et trading.
  5. Counters d'error et de discard : CRC errors, FCS errors, output drops ; des valeurs non-zero soutenues signifient câblage, optique ou buffering en souffrance.
  6. Temps de résolution DNS : souvent le contributeur silencieux aux page loads lentes quand un resolver autoritaire se dégrade.

Comment faire tourner le network monitoring

Choisis un poller (SNMP pour l'équipement traditionnel, gNMI ou streaming telemetry pour Cisco/Juniper/Arista modernes), pointe-le sur chaque device, et stocke les time series dans Prometheus, InfluxDB ou le backend du vendor. Ajoute des active probes (smokeping, blackbox_exporter) pour la latence synthétique entre sites. Ajoute un flow collector (nfdump, Akvorado, Kentik) pour la visibilité par conversation. Construis ensuite des dashboards organisés par site, par service et par SLA, avec des alertes sur les métriques qui mappent à l'impact utilisateur (loss, latence, link saturation) plutôt que sur chaque counter qui existe.

Le network monitoring complète le load testing. Quand un load test montre une latence dégradée, le network monitoring te dit si le bottleneck est dans le réseau (uplink saturé, packet loss) ou au dessus (application lente, base de données lente). Combine les deux signaux pendant une launch readiness review. Voir aussi latence pour le framework de percentiles qui sous-tend les deux disciplines.

Si ton équipe a besoin de trafic production-shape généré contre le réseau monitoré pour valider la capacity, LoadFocus propose des services de load testing depuis des régions cloud alignées avec la géographie réelle de tes utilisateurs, avec des runs planifiés pour coïncider avec tes fenêtres de baseline de network monitoring.

Quelle est la vitesse de votre site web?

Augmentez sa vitesse et son référencement naturel de manière transparente avec notre Test de Vitesse gratuit.

Test gratuit de vitesse du site Web

Analyser la vitesse de chargement de votre site Web et améliorer ses performances avec notre outil gratuit de vérification de la vitesse de la page.

×