3 commentaires
hmm ça sent le for clause trop court dans ta règle d'alerte. si t'as for: 10s et que prometheus ne voit pas la condition vraie pendant au moins 10s consécutives ça va pas fonctionner si t'as des micro-absences de métrique ou des fluctuations. essaye de mettre for: 1m pour voir si ça tient
ou alors ton exporter il envoie des données stale ou alors c'est un counter qui est reset trop vite ce qui fait que la valeur moyenne calculée sur la période tombe. regarde bien l'historique de la métrique dans prometheus UI
Laisser une réponse
Vous devez être connecté pour poster un message !
salut tout le monde, j'ai un truc chelou avec mes alertes prometheus. elles se déclenchent bien dans alertmanager, je vois la notif slack, et 10 secondes après elles passent en résolues alors que la condition de l'alerte est toujours vraie. c'est quoi ce bordel ? mon scrape interval est de 15s et l'eval interval de 15s aussi