Sujet :

Prometheus : alertes 'cible down' trop sensibles

RÉSOLU

Liste des sujets Répondre Créer un sujet

mlegros

Membre depuis le 29/07/2024

yo l'équipe on a prometheus qui nous spam d'alertes target down pour des cibles qui disparaissent et reviennent en 30 secondes. on veut pas être alerté si c'est juste un redémarrage ou un déploiement rapide. comment on gère ça proprement ?


# règle actuelle
- alert: TargetDown
  expr: up == 0
  for: 0s
  labels:
    severity: critical
  annotations:
    summary: "Prometheus target {{ $labels.instance }} down"

camille35

Membre depuis le 02/07/2024

salut pour les redémarrages t'utilises la clause for: 5m par exemple. l'alerte ne se déclenchera qu'après 5 minutes de up == 0. ça filtre pas mal le bruit

alice-pages

Membre depuis le 09/12/2024

et pense à ajouter un group_left avec up et d'autres métriques pour avoir plus de contexte quand ça tombe. ça aide à trier les vrais problèmes des faux positifs

mlegros

Membre depuis le 29/07/2024

ok je vais tester le for: 5m et je vais voir pour le group_left après. j'espère que ça va calmer un peu les notifs. thx !

Répondre

vous devez être connecté pour poster un message !

Rejoindre la communauté

Recevoir les derniers articles gratuitement en créant un compte !

S'inscrire