C'est souvent que ton scrape_timeout est plus court que le temps de réponse réel de ton application quand elle génère des milliers de métriques. Vérifie ta config globale ou celle du job.
scrape_timeout: 10s
Teste le temps de réponse total avec un `curl` qui mesure le temps de transfert, car Prometheus doit télécharger tout le payload avant le timeout.
time curl -s http://ton-app:8080/metrics > /dev/null
Ah oui, le `time curl` m'indique 12 secondes de transfert... J'ai trop de métriques de cardinalité haute sur ce service. J'ai monté le timeout à 15s et c'est stable. Top !
Vous devez être connecté pour poster un message !
Recevoir les derniers articles gratuitement en créant un compte !
S'inscrire
menard-eric
Membre depuis le 23/05/2024J'ai plusieurs targets dans Prometheus qui passent en Down avec l'erreur context deadline exceeded. Pourtant quand je curl l'endpoint manuellement ça répond vite.
Pourquoi Prometheus coupe la connexion ?