4 commentaires
salut. c'est un souci de threshold trop bas ou de duration trop courte ? si tes pods ont des pics d'utilisation courts c'est normal que ça flappe. essaie d'augmenter la duration de ton alerte à genre 5min et de mettre un threshold un peu plus haut. et regarde la métrique rate(container_cpu_usage_seconds_total[5m]) au lieu du instant
Laisser une réponse
Vous devez être connecté pour poster un message !
yo la team. on a des alertes Prometheus qui flappent non-stop sur les pods de nos microservices. genre
cpuusagehighouMemoryUsageHigh. ça s'active 30s puis ça se désactive direct. c'est super chiant on sait plus quoi regarder