Debuguer des pics de latence sur Redis avec la commande slowlog

Question

Salut à tous, je galère sur une instance Redis en prod. J'ai des pics de latence sporadiques qui font exploser mes temps de réponse API. J'ai checké les métriques de base, rien d'anormal sur le CPU.

Je soupçonne une commande bloquante ou un problème de scan. Quelqu'un a une méthode efficace pour corréler les logs avec des événements spécifiques ?

ksimon · Answer

As-tu activé le slowlog ? C'est la première chose à faire pour voir les commandes qui dépassent un seuil de temps défini.

henri-leroux · Answer

Oui, j'ai configuré slowlog-log-slower-than 10000, mais les logs sont assez vides malgré les spikes. C'est ça qui est étrange.

alexandre-anne · Answer

Si le slowlog est vide, regarde du côté des keyspace notifications ou si tu n'as pas des opérations de keys * qui passent en douce.

kblanc · Answer

Vérifie aussi le latency monitor natif de Redis. Il permet de capturer des événements de latence même en dessous du seuil du slowlog.

ksimon · Answer

Exact, lance la commande suivante pour voir les derniers événements enregistrés :redis-cli --latency-history

henri-leroux · Answer

Je viens de voir des pics lors du BGSAVE. Ça semble être le coupable.

alexandre-anne · Answer

C'est classique. Le fork du processus lors du snapshot peut bloquer l'instance si la mémoire est fragmentée ou si tu as beaucoup de clés.

kblanc · Answer

Essaye de désactiver rdbcompression si ton CPU est large, ou bascule sur du AOF avec une politique de fsync moins agressive.

ksimon · Answer

Vérifie aussi si transparent_hugepage est activé sur ton noyau Linux. Ça cause souvent des latences lors des opérations de fork Redis.

henri-leroux · Answer

Bien vu pour transparent_hugepage, c'est activé par défaut sur nos nodes. Je teste la désactivation et je vous tiens au courant.

alexandre-anne · Answer

Pense aussi à monitorer le temps de fork avec la commande info stats sous la section latest_fork_usec.

kblanc · Answer

Si le problème persiste, envisage de déporter les snapshots sur une instance replica dédiée.

henri-leroux · Answer

Problème résolu après désactivation des THP et ajustement des périodes de snapshot. Merci pour les pistes, c'était bien le fork qui bloquait tout.

Debuguer des pics de latence sur Redis avec la commande slowlog

13 commentaires

Laisser une réponse

Fonctionnement et manipulation des images Docker

Utilisation des modules sur Terraform

L'histoire du DevOps

Jumeaux Numériques : La Révolution des Opérations Prédictives

L'IA au Service du Flow: Le Neuro-DevOps pour une Productivité Inégalée

Rejoindre la communauté