augmente ton scrape_timeout dans ta config prometheus par défaut c'est souvent trop court si ton app met du temps à générer les métriques
scrape_timeout: 30s
vérifie aussi si t'as pas des network policies qui drop le traffic venant du namespace de prometheus ou si t'as pas un souci de mtu sur ton cni
c'était bien le timeout j'ai passé à 15s au lieu de 5s et plus de soucis de targets down merci
Vous devez être connecté pour poster un message !
Recevoir les derniers articles gratuitement en créant un compte !
S'inscrire
philippe-marthe
Membre depuis le 29/10/2024mes targets tombent en timeout les unes après les autres sur mon cluster k8s alors que les pods sont bien en vie et répondent au curl