prometheus alerte cpu load trop tardive

lmarty 14/07/2025
RÉSOLU
lmarty
Auteur Actif
Avatar de lmarty
lmarty
Auteur Actif

salut les sres j'ai un souci avec mes alertes prometheus sur le cpu load. quand un serveur commence à morfler je reçois l'alerte genre 5-10min après que le load soit monté. je voudrais un truc plus réactif genre max 1-2min. vous avez des tips pour optimiser ça


# extrait de ma rule prometheus
- alert: HighCPULoad
  expr: node_load1 > 8
  for: 5m
  labels:
    severity: critical
  annotations:
    summary: "CPU load est trop élevé sur {{ $labels.instance }}"
14/07/2025 à 12:11

3 commentaires

delmas-zoe
Membre
Avatar de delmas-zoe
delmas-zoe
Membre

ta config for 5m c'est trop long c'est ça qui retarde l'alerte essaie de le baisser à 1m ou même 30s si t'es sur que ton monitoring est pas trop bruyant sinon tu vas avoir des alertes fantômes

15/07/2025 à 08:12
crenaud
Membre Actif
Avatar de crenaud
crenaud
Membre Actif

et le scrape interval de ton node_exporter c'est quoi si c'est 15s ou 30s c'est bon mais si c'est 1m bah forcément tu vas capter l'info plus tard. faut que ton scrape soit plus petit que ton for duration

16/07/2025 à 04:27
lmarty
Auteur Actif
Avatar de lmarty
lmarty
Auteur Actif

ok merci pour les tips. j'ai mis le for à 1m et le scrape interval était déjà à 15s. je vais voir ce que ça donne mais ça devrait être mieux. je ferai un retour si ça pose problème

17/07/2025 à 00:54

Laisser une réponse

Vous devez être connecté pour poster un message !

Rejoindre la communauté

Recevoir les derniers articles gratuitement en créant un compte !

S'inscrire