Prometheus : Alerte qui s'auto-mute après quelques secondes

Posté par plombard le 28/02/2026
RÉSOLU

plombard

Membre depuis le 08/06/2019

salut tout le monde, j'ai un truc chelou avec mes alertes prometheus. elles se déclenchent bien dans alertmanager, je vois la notif slack, et 10 secondes après elles passent en résolues alors que la condition de l'alerte est toujours vraie. c'est quoi ce bordel ? mon scrape interval est de 15s et l'eval interval de 15s aussi

Commentaires

marion-noel

Membre depuis le 22/03/2019

hmm ça sent le for clause trop court dans ta règle d'alerte. si t'as for: 10s et que prometheus ne voit pas la condition vraie pendant au moins 10s consécutives ça va pas fonctionner si t'as des micro-absences de métrique ou des fluctuations. essaye de mettre for: 1m pour voir si ça tient

helene-meunier

Membre depuis le 18/12/2020

ou alors ton exporter il envoie des données stale ou alors c'est un counter qui est reset trop vite ce qui fait que la valeur moyenne calculée sur la période tombe. regarde bien l'historique de la métrique dans prometheus UI

plombard

Membre depuis le 08/06/2019

c'était bien la clause for ! j'avais mis 10s et avec les fluctuations du réseau la métrique passait en no_data quelques ms et ça coupait l'alerte. je suis passé à 30s et ça marche nickel. merci les gars !

Laisser une réponse

Vous devez être connecté pour poster un message !

Rejoindre la communauté

Recevoir les derniers articles gratuitement en créant un compte !

S'inscrire