Membre depuis le 25/03/2019
salut
tu as regardé du côté du scheduler i/o ? le default pour la plupart des distros est
mq-deadline mais des fois si tu as des workloads très spécifiques genre bdd avec plein de petites requetes random ça peut être mieux de passer sur noop ou bfq. teste avec cat /sys/block/sdX/queue/scheduler
Membre depuis le 02/02/2020
et les
vm.dirty_ratio vm.dirty_background_ratio tu les as ajustés ? si ton app écrit beaucoup et que ces buffers sont trop petits le kernel va devoir flusher agressivement et ça peut bloquer. surtout avec une petite vmware disk cache
Membre depuis le 11/04/2020
le scheduler est bien
mq-deadline. j'ai pas touché aux dirty_ratio c'est les valeurs par defaut. l'app fait pas tant d'écriture que ça c'est surtout des lectures et qques petites écritures de logs. c'est la lecture qui me parait lente
Membre depuis le 05/07/2024
t'as vérifié si le disque est pas en train de se remplir dangereusement ? genre 90%+ plein. des fois ça peut impacter les perfs de ouf. aussi regarde
dmesg | grep -i error pour voir si le kernel ne rapporte pas des erreurs disque
Membre depuis le 25/03/2019
des trucs côté hyperviseur ? parfois les SAN ou le stockage partagé derrière ont des soucis de contention que tu ne vois pas au niveau de la VM. Ou un autre VM sur le même datastore qui fait n'importe quoi en I/O et qui impacte tout le monde
Membre depuis le 11/04/2020
disque à 60% plein c'est ok. dmesg clean. côté hyperviseur non les métriques de latency et iops sur le datastore sont niquels. et on a mis la vm sur un datastore peu chargé. par contre j'ai vu des
jbd2/dm-0-8 qui consomment pas mal d'iops quand ça merde, c'est le journal ext4
Membre depuis le 02/02/2020
jbd2 qui tourne à fond ça sent la corruption ou un fsck qui se passe mal au boot. t'as tenté un
fsck -f /dev/sdX après un unmount ou en mode rescue ? ça peut purger des problèmes. ou un tune2fs -l /dev/sdx | grep 'maximum mount count' pour voir si t'es pas trop près du max et qu'il force le check
Membre depuis le 11/04/2020
bingo c'était ça ! le mount count était très haut et un fsck forcé en mode rescue a trouvé et réparé des petites inconsistances. depuis ça tourne nickel. thx la team c'était bien relou ce truc !
Vous devez être connecté pour poster un message !
Recevoir les derniers articles gratuitement en créant un compte !
S'inscrire
alix90
Membre depuis le 11/04/2020
salut les pros
j'ai une vm linux (ubuntu 20.04) sur laquelle tourne une app critique. depuis hier on a des lags monstres des fois pendant 30s l'app est injoignable ou prend des plombes pour répondre. j'ai l'impression que c'est lié aux I/O disque parce que les logs montrent des
de ouf et le monte à 100% utilisation sur le disque système.le truc c'est que la charge cpu est faible la mémoire est ok. on n'a pas de gros batch I/O qui tourne. j'ai check les métriques de notre hyperviseur (vmware) les iops sont stables pas de pic flagrant.
ou montrent rien de particulier aucune application ne semble monopoliser le disque. des pistes pour ce mystère ?