13 commentaires
Oui, j'ai configuré slowlog-log-slower-than 10000, mais les logs sont assez vides malgré les spikes. C'est ça qui est étrange.
Si le slowlog est vide, regarde du côté des keyspace notifications ou si tu n'as pas des opérations de keys * qui passent en douce.
Je viens de voir des pics lors du BGSAVE. Ça semble être le coupable.
C'est classique. Le fork du processus lors du snapshot peut bloquer l'instance si la mémoire est fragmentée ou si tu as beaucoup de clés.
Bien vu pour transparent_hugepage, c'est activé par défaut sur nos nodes. Je teste la désactivation et je vous tiens au courant.
Pense aussi à monitorer le temps de fork avec la commande info stats sous la section latest_fork_usec.
Problème résolu après désactivation des THP et ajustement des périodes de snapshot. Merci pour les pistes, c'était bien le fork qui bloquait tout.
Laisser une réponse
Vous devez être connecté pour poster un message !
Salut à tous, je galère sur une instance Redis en prod. J'ai des pics de latence sporadiques qui font exploser mes temps de réponse API. J'ai checké les métriques de base, rien d'anormal sur le CPU.
Je soupçonne une commande bloquante ou un problème de scan. Quelqu'un a une méthode efficace pour corréler les logs avec des événements spécifiques ?