Membre depuis le 09/03/2024
help ! j'ai fait une maj du node exporter sur plusieurs serveurs. tout s'est bien passé les pods sont up les targets prometheus aussi. mais j'ai des métriques importantes qui sont plus remontées comme node_cpu_idle_seconds_total ou node_disk_read_bytes_total. y'a juste plus la donnée dans grafana. on dirait que certaines métriques ont disparu carrément.
# extrait de la config prometheus
- job_name: 'nodes'
static_configs:
- targets: ['node1:9100', 'node2:9100']
Vous devez être connecté pour poster un message !
Recevoir les derniers articles gratuitement en créant un compte !
S'inscrire
Commentaires
couturier-marcelle
Membre depuis le 27/06/2024
hmm ça sent le changement de nom des métriques entre les versions de node exporter. la v1.0 a pas mal remanié ça. t'as regardé les logs du node exporter sur une des machines affectées ? il doit loguer les métriques qu'il expose. compare avec l'ancienne version si tu peux
renard-nath
Membre depuis le 13/05/2024
oui exactement regarde les scrape configs de prometheus et les relabeling rules. si tu avais des règles spécifiques pour filtrer ou renommer les métriques avant elles pourraient maintenant faire sauter les nouvelles métriques. ou bien prometheus scrape_interval trop court et l'exporter galère à répondre
hleblanc
Membre depuis le 04/07/2024
un truc à vérifier aussi c'est la compatibilité de ta version de node exporter avec le kernel linux que t'as. des fois certaines features kernel sont pas exposées pareil ou via des fichiers différents et l'exporter peut pas lire les données. t'as quel os et kernel version ?
lmarty
Membre depuis le 10/05/2024
ah la vache vous avez mis le doigt dessus ! c'était un mélange des deux. la nouvelle version du node exporter a renommé plein de métriques et notre prometheus avait des relabel_configs un peu trop génériques. j'ai dû les ajuster pour matcher les nouveaux noms. un bon coup de prometheus /metrics endpoint et de regex et c'est reparti. thx la team !