6 commentaires
hello le rbac de k8s a pu changer entre ces versions. vérifie les rbac roles et rolebindings pour le service account de prometheus est-ce qu'il a toujours les droits de list/watch sur les pods services endpoints etc dans tous les namespaces ?
ouais et assure-toi que tes service monitors et pod monitors sont toujours valides ils ont pas été écrasés ou modifiés ? des fois l'opérateur recrée des trucs et les labels selectors peuvent être cassés
y'a pas une network policy qui bloque le trafic entre prometheus et tes apps ? l'upgrade a pu modifier les règles par défaut ou en ajouter de nouvelles
et le prometheus operator lui-même il est bien compatible avec k8s 1.27 ? des fois faut l'upgrader avant le cluster ou juste après sinon il déconne
c'était bien ça les gars c'était le rbac pour le service account de prometheus. avec l'upgrade de k8s les permissions sur les apiresources avaient changé j'ai dû rajouter des verbes pour les endpointslices et les ingresses. après ça prometheus a tout de suite retrouvé ses cibles. merci pour l'aide précieuse !
Laisser une réponse
Vous devez être connecté pour poster un message !
salut la team on a upgrade notre cluster k8s de 1.25 à 1.27 ce matin et depuis prometheus ne scrape plus rien. toutes les targets sont down ou unknown. l'opérateur prometheus est à jour les pods prometheus sont up sans erreur dans les logs. on sèche là.