Prometheus : alertes 'cible down' trop sensibles

mlegros 30/12/2025
RÉSOLU
mlegros
Auteur
Avatar de mlegros
mlegros
Auteur

yo l'équipe on a prometheus qui nous spam d'alertes target down pour des cibles qui disparaissent et reviennent en 30 secondes. on veut pas être alerté si c'est juste un redémarrage ou un déploiement rapide. comment on gère ça proprement ?


# règle actuelle
- alert: TargetDown
  expr: up == 0
  for: 0s
  labels:
    severity: critical
  annotations:
    summary: "Prometheus target {{ $labels.instance }} down"
30/12/2025 à 00:09

3 commentaires

camille35
Membre Actif
Avatar de camille35
camille35
Membre Actif

salut pour les redémarrages t'utilises la clause for: 5m par exemple. l'alerte ne se déclenchera qu'après 5 minutes de up == 0. ça filtre pas mal le bruit

30/12/2025 à 21:11
alice-pages
Membre Actif Secouriste
Avatar de alice-pages
alice-pages
Membre Actif Secouriste

et pense à ajouter un group_left avec up et d'autres métriques pour avoir plus de contexte quand ça tombe. ça aide à trier les vrais problèmes des faux positifs

31/12/2025 à 18:20
mlegros
Auteur
Avatar de mlegros
mlegros
Auteur

ok je vais tester le for: 5m et je vais voir pour le group_left après. j'espère que ça va calmer un peu les notifs. thx !

01/01/2026 à 14:02

Laisser une réponse

Vous devez être connecté pour poster un message !

Rejoindre la communauté

Recevoir les derniers articles gratuitement en créant un compte !

S'inscrire