Debuguer les latences d'écriture disque sur un node EKS

suzanne-alexandre 09/05/2026
RÉSOLU
suzanne-alexandre
Auteur Actif
Avatar de suzanne-alexandre
suzanne-alexandre
Auteur Actif

J'ai un nœud EKS qui subit des pics de latence disque énormes sur des volumes EBS GP3. Mes logs iostat montrent un await qui monte au-delà de 200ms par moment.

Comment puis-je isoler si c'est le volume qui sature ses IOPS ou si c'est le kernel qui bloque sur le filesystem ?

09/05/2026 à 05:11

10 commentaires

As-tu vérifié les métriques CloudWatch pour le volume ? Si tu as atteint la limite de débit ou d'IOPS, EBS throttle tes requêtes en mode silencieux.

09/05/2026 à 20:09
suzanne-alexandre
Auteur Actif
Avatar de suzanne-alexandre
suzanne-alexandre
Auteur Actif

Oui, les métriques montrent une utilisation à 90% du quota alloué. Mais ça n'explique pas pourquoi le système semble figé.

10/05/2026 à 17:16

Regarde du côté de dmesg pour voir s'il n'y a pas des erreurs blk_update_request. Si le kernel attend trop longtemps, il finit par marquer le filesystem en lecture seule parfois.

11/05/2026 à 13:17

Utilise iotop -o pour identifier le processus coupable. Ça pourrait être un backup ou un process logrotate qui sature la bande passante.

12/05/2026 à 02:59
suzanne-alexandre
Auteur Actif
Avatar de suzanne-alexandre
suzanne-alexandre
Auteur Actif

Bonne idée, je n'avais pas pensé à iotop en mode batch. Je vais le laisser tourner quelques minutes.

12/05/2026 à 16:32

Si tu es sur une instance Nitro, tu peux aussi monitorer les EBSBandwidth via la console EC2 pour corréler les pics.

13/05/2026 à 14:34

Si le throughput est le problème, bascule sur du io2 ou augmente simplement la taille du volume GP3 pour obtenir plus d'IOPS par défaut.

14/05/2026 à 09:11
suzanne-alexandre
Auteur Actif
Avatar de suzanne-alexandre
suzanne-alexandre
Auteur Actif

Je viens d'identifier le processus : c'est un agent de log qui écrit des fichiers énormes en mode synchrone. Je vais passer en asynchrone pour voir si ça calme le jeu.

15/05/2026 à 02:35

Excellente approche. Évite toujours les écritures synchrones sur des disques réseaux si tu n'en as pas strictement besoin pour la cohérence des données.

15/05/2026 à 14:39
suzanne-alexandre
Auteur Actif
Avatar de suzanne-alexandre
suzanne-alexandre
Auteur Actif

Problème résolu. Merci pour l'aide précieuse sur l'investigation système.

16/05/2026 à 09:52

Laisser une réponse

Vous devez être connecté pour poster un message !

Rejoindre la communauté

Recevoir les derniers articles gratuitement en créant un compte !

S'inscrire