Prometheus : Alerte qui s'auto-mute après quelques secondes

plombard 28/02/2026
RÉSOLU
plombard
Auteur Actif
Avatar de plombard
plombard
Auteur Actif

salut tout le monde, j'ai un truc chelou avec mes alertes prometheus. elles se déclenchent bien dans alertmanager, je vois la notif slack, et 10 secondes après elles passent en résolues alors que la condition de l'alerte est toujours vraie. c'est quoi ce bordel ? mon scrape interval est de 15s et l'eval interval de 15s aussi

28/02/2026 à 01:09

3 commentaires

marion-noel
Membre Actif
Avatar de marion-noel
marion-noel
Membre Actif

hmm ça sent le for clause trop court dans ta règle d'alerte. si t'as for: 10s et que prometheus ne voit pas la condition vraie pendant au moins 10s consécutives ça va pas fonctionner si t'as des micro-absences de métrique ou des fluctuations. essaye de mettre for: 1m pour voir si ça tient

28/02/2026 à 23:10
helene-meunier
Membre Actif
Avatar de helene-meunier
helene-meunier
Membre Actif

ou alors ton exporter il envoie des données stale ou alors c'est un counter qui est reset trop vite ce qui fait que la valeur moyenne calculée sur la période tombe. regarde bien l'historique de la métrique dans prometheus UI

01/03/2026 à 20:22
plombard
Auteur Actif
Avatar de plombard
plombard
Auteur Actif

c'était bien la clause for ! j'avais mis 10s et avec les fluctuations du réseau la métrique passait en no_data quelques ms et ça coupait l'alerte. je suis passé à 30s et ça marche nickel. merci les gars !

02/03/2026 à 19:42

Laisser une réponse

Vous devez être connecté pour poster un message !

Rejoindre la communauté

Recevoir les derniers articles gratuitement en créant un compte !

S'inscrire