Was ist Network Monitoring?

Network Monitoring beobachtet kontinuierlich Infrastruktur, die Services und Nutzer verbindet: Links, Devices, Packet Loss, Latenz, Jitter, BGP, DNS.

Was ist Network Monitoring?

Network Monitoring ist die Disziplin, kontinuierlich Health, Performance und Traffic Flow der Netzwerk-Infrastruktur zu beobachten, die Server, Services und Nutzer verbindet. Es überwacht Devices (Router, Switches, Firewalls, Load Balancer, Access Points), Links (Bandbreitenauslastung, Packet Loss, Latenz, Jitter) und die darüber laufenden Protokolle (BGP, OSPF, DNS, TLS), damit ein Operator einen degraded Link, einen saturated Uplink oder ein flapping Interface erkennt, bevor Nutzer langsame Page Loads oder fehlschlagende API Calls bemerken.

Der Output ist meist eine Echtzeit-Topologie-Ansicht, Per-Interface Metric Graphs, Threshold Alerts auf Counter wie Bandbreite oder Error Rate und eine Flow Database (NetFlow, sFlow, IPFIX), die beantwortet "welcher Traffic lief um 14:32 über diesen Link." Tools im Space sind SolarWinds, PRTG, LibreNMS, Zabbix, Nagios, Cisco ThousandEyes, Kentik und Catchpoint.

Network Monitoring vs Infrastructure Monitoring vs APM

Diese drei Layer überlappen in Tooling, beantworten aber unterschiedliche Fragen:

  • Network Monitoring beobachtet die Pipes: Link-Auslastung, Packet Loss, Routing-Änderungen, DNS-Auflösungszeit. Beste Wahl für "das Netzwerk ist langsam" Beschwerden.
  • Infrastructure Monitoring beobachtet die Hosts: CPU, Memory, Disk, Container-Count, Kernel-Metriken. Beste Wahl für "dieser Server ist überlastet."
  • APM beobachtet die Anwendung: Per-Endpoint Latenz, langsame DB-Queries, Error Rate per Code Path. Beste Wahl für "Checkout ist langsam für diesen Kunden."

Ein vollständiger Operations Stack betreibt alle drei. Siehe Infrastructure Monitoring und Application Performance Monitoring für die angrenzenden Layer.

Was Network Monitoring abdeckt

  • Availability: ICMP Ping, SNMP up/down, Port-Reachability Checks in festen Intervallen.
  • Bandbreite und Durchsatz: Bytes pro Sekunde per Interface, Peak vs Average, Percentile-Auslastung über Zeit.
  • Loss, Latenz, Jitter: Active Probes (synthetic) oder Passive Flow Analysis; die drei klassischen Real-Time-Traffic Killer.
  • Routing- und Protokoll-Health: BGP Session State, OSPF Neighbor Changes, MPLS LSP up/down Events.
  • Flow Data: NetFlow/sFlow/IPFIX Records per Conversation, genutzt für Capacity Planning und Security-Forensik.
  • Configuration Drift: Snapshot der Device-Configs, Diff über Zeit, Alert wenn eine Änderung unauthorized ist.

Wichtige Network-Monitoring-Metriken

  1. Uptime und Availability-Prozent: per Device und per Link, aggregiert auf eine Service-SLA.
  2. Bandbreitenauslastung: Prozent der Link-Kapazität in Nutzung, p95 über das Messfenster.
  3. Packet Loss Prozent: Dropped Packets geteilt durch Sent, beobachtet per Interface und per Probe Path.
  4. Latenz (RTT) und Jitter: Round-Trip Time und ihre Varianz, kritisch für VoIP, Video und Trading.
  5. Error- und Discard-Counter: CRC Errors, FCS Errors, Output Drops; anhaltend non-zero Werte bedeuten Verkabelung, Optik oder Buffering Trouble.
  6. DNS-Auflösungszeit: oft der stille Beitrag zu langsamen Page Loads, wenn ein authoritativer Resolver degradiert.

Wie man Network Monitoring betreibt

Wähle einen Poller (SNMP für klassische Gear, gNMI oder Streaming Telemetry für moderne Cisco/Juniper/Arista), richte ihn auf jedes Device und speichere die Time Series in Prometheus, InfluxDB oder dem Vendor-Backend. Ergänze Active Probes (smokeping, blackbox_exporter) für synthetische Latenz zwischen Sites. Ergänze einen Flow Collector (nfdump, Akvorado, Kentik) für Per-Conversation Visibility. Baue dann Dashboards organisiert nach Site, Service und SLA, mit Alerts auf den Metriken, die auf User Impact mappen (Loss, Latenz, Link Saturation), statt auf jeden Counter, der existiert.

Network Monitoring ergänzt Load Testing. Wenn ein Load Test degradierte Latenz zeigt, sagt Network Monitoring dir, ob der Bottleneck im Netzwerk liegt (saturated Uplink, Packet Loss) oder darüber (langsame Anwendung, langsame DB). Pair beide Signale während eines Launch-Readiness-Review. Siehe auch Latenz für das Percentile-Framework, das beiden Disziplinen zugrunde liegt.

Wenn dein Team production-shape Traffic gegen das überwachte Netzwerk braucht, um Capacity zu validieren, bietet LoadFocus Load Testing Services aus Cloud-Regionen passend zu deiner echten User-Geographie, mit Runs geplant in deinen Network-Monitoring-Baseline-Fenstern.

Wie schnell ist Ihre Website?

Steigern Sie ihre Geschwindigkeit und SEO nahtlos mit unserem kostenlosen Geschwindigkeitstest.

Kostenloser Websitespeed-Test

Analysieren Sie die Ladegeschwindigkeit Ihrer Website und verbessern Sie ihre Leistung mit unserem kostenlosen Seitengeschwindigkeits-Checker.

×