C'est presque toujours le disque. etcd a besoin d'une latence d'écriture hyper faible. Si tu es sur AWS, tes volumes GP2/GP3 sont peut-être à court d'IOPS.
Tu peux forcer la priorité I/O pour le process etcd avec ionice pour éviter qu'un autre process ne lui vole la bande passante.
ionice -c2 -n0 -p $(pgrep etcd)
Vérifie les métriques 'etcd_disk_wal_fsync_duration_seconds'. Si c'est au dessus de 10ms régulièrement, change tes disques pour des SSD NVMe.
C'était bien le disque. Un vieux cron de backup saturait les IOPS. J'ai déplacé etcd sur des volumes dédiés et tout est fluide. Merci beaucoup.
Vous devez être connecté pour poster un message !
Recevoir les derniers articles gratuitement en créant un compte !
S'inscrire
baubry
Membre depuis le 18/10/2024Mon cluster Kubernetes est super lent, kubectl met 10 secondes à répondre. Les logs etcd disent 'apply entries took too long'.
C'est un problème réseau ou disque ?