Alerting
Dreifaches Alerting-System: Prometheus-Alerts via ntfy, externe Überwachung via Uptime Kuma, Heartbeat via Healthchecks. Container-Update-Benachrichtigungen via MqDockerUp.
Alertmanager
GitHub · prom/alertmanager:v0.31.1
|
|
| URL |
https://alertmanager.home.robinwerner.net |
| Speicher |
/mnt/ssd/container-data/monitoring-stack/alertmanager (<100 MB) |
| User |
nobody:nobody |
ntfy-Integration
Alerts werden via Webhook an ntfy auf dem Hetzner vServer gesendet.
|
|
| URL |
https://ntfy.homelab-external.robinwerner.net/ |
| Authentifizierung |
password_file (kein Klartext) |
| Protokoll |
HTTPS (kein VPN/Tailnet nötig) |
Routing
| Severity |
ntfy-Topic |
Repeat-Interval |
| critical |
homelab-critical |
1 Stunde |
| warning |
homelab-alerts |
4 Stunden |
Alert-Rules
Critical (Push sofort)
| Alert |
Bedingung |
For |
| DiskAlmostFull |
Filesystem < 10% frei |
5m |
| ContainerDown |
Wichtige Container absent |
5m |
| NfsMountLost |
NFS-Mountpoint nicht verfügbar |
2m |
Wichtige Container (Critical bei Ausfall): traefik, homeassistant, grafana, prometheus, pihole.
Warning (Dashboard + Push nach 4h)
| Alert |
Bedingung |
For |
| HighCPU |
CPU > 80% |
10m |
| HighMemory |
RAM > 85% |
10m |
| DiskSpaceLow |
Filesystem < 20% frei |
10m |
| ContainerRestarting |
Restart-Count > 3 in 15m |
15m |
Konfigurationsdateien
| Datei |
Inhalt |
configs/prometheus/rules/node-alerts.yml |
DiskAlmostFull, DiskSpaceLow, HighCPU, HighMemory, NfsMountLost |
configs/prometheus/rules/container-alerts.yml |
ContainerDown, ContainerRestarting |
configs/alertmanager/alertmanager.yml |
Routing zu ntfy (critical/warning Topics) |
Dreifaches Alerting
Pfad 1: Prometheus -> Alertmanager -> ntfy -> Handy
Pfad 2: Uptime Kuma (Hetzner) -> ntfy -> Handy (bei NUC-Ausfall)
Pfad 3: NUC Heartbeat-Cronjob -> Healthchecks (Hetzner) -> ntfy -> Handy
- Pfad 1 erkennt Service-Probleme auf dem NUC
- Pfad 2 erkennt einen kompletten NUC-Ausfall (extern überwacht)
- Pfad 3 erkennt Netzwerk- oder Cronjob-Probleme (Dead-Man's-Switch)
MqDockerUp
GitHub · micrib/mqdockerup:v1.23.7
Container-Update-Benachrichtigungen via MQTT an Home Assistant.
|
|
| Netzwerk |
proxy_network (Zugriff auf Mosquitto) |
| Speicher |
/mnt/ssd/container-data/monitoring-stack/mqdockerup (SQLite) |
| Docker-Socket |
Read-Only gemountet |
Konfiguration
| Parameter |
Wert |
| Container-Check |
alle 5 Minuten |
| Update-Check |
stündlich |
| MQTT-Discovery |
homeassistant (Auto-Discovery für HA) |
| GitHub Token |
Fine-grained PAT für GHCR-Image-Checks (optional) |