Membre depuis le 22/03/2019
hmm ça sent le for clause trop court dans ta règle d'alerte. si t'as for: 10s et que prometheus ne voit pas la condition vraie pendant au moins 10s consécutives ça va pas fonctionner si t'as des micro-absences de métrique ou des fluctuations. essaye de mettre for: 1m pour voir si ça tient
Membre depuis le 18/12/2020
ou alors ton exporter il envoie des données stale ou alors c'est un counter qui est reset trop vite ce qui fait que la valeur moyenne calculée sur la période tombe. regarde bien l'historique de la métrique dans prometheus UI
Membre depuis le 08/06/2019
c'était bien la clause for ! j'avais mis 10s et avec les fluctuations du réseau la métrique passait en no_data quelques ms et ça coupait l'alerte. je suis passé à 30s et ça marche nickel. merci les gars !
Vous devez être connecté pour poster un message !
Recevoir les derniers articles gratuitement en créant un compte !
S'inscrire
plombard
Membre depuis le 08/06/2019
salut tout le monde, j'ai un truc chelou avec mes alertes prometheus. elles se déclenchent bien dans alertmanager, je vois la notif slack, et 10 secondes après elles passent en résolues alors que la condition de l'alerte est toujours vraie. c'est quoi ce bordel ? mon scrape interval est de 15s et l'eval interval de 15s aussi