Membre depuis le 19/05/2024
yo la team j'ai un souci bizarre sur notre cluster EKS. les résolutions DNS sont hyper lentes genre 500ms des fois alors que ça devrait être quasi instantané. on utilise CoreDNS par défaut. j'ai checké les logs des pods CoreDNS et pas d'erreurs flagrantes, juste que ça prend du temps. une idée d'où ça peut venir ?
kubectl logs -n kube-system -l k8s-app=kube-dns
Vous devez être connecté pour poster un message !
Recevoir les derniers articles gratuitement en créant un compte !
S'inscrire
Commentaires
louis-albert
Membre depuis le 15/06/2024
hello t'as regardé les métriques cpu/mémoire de tes pods coredns ? des fois ils sont throttlés si les limites sont trop basses et ça ralentit tout. ou si t'as un gros traffic dns, coredns est ptete sous-dimensionné en réplicas ou en ressources
durand-lucas
Membre depuis le 19/02/2025
et t'es sûr que ton VPC DNS resolver est pas surchargé ? les requêtes qui ne sont pas résolues par CoreDNS (genre les externes) partent vers le resolver du VPC. chaque subnet a une limite. regarde si t'as des `SERVFAIL` ou des `NXDOMAIN` dans les logs CoreDNS
jean-bigot
Membre depuis le 19/05/2024
les pods CoreDNS sont ok niveau ressources. j'ai mis plus de réplicas pour voir mais ça change pas grand chose. pour le VPC resolver j'ai pas pensé à ça, comment je peux monitorer ça ?
rrenaud
Membre depuis le 14/02/2025
le VPC resolver c'est galère à monitorer direct. mais si t'as un service mesh genre istio ou linkerd qui interceptent le DNS ça peut être une piste aussi. sinon, et c'est con, mais t'as un MTU de 1500 sur tes interfaces ? si t'as des jumbo frames (9001) et qu'un équipement au milieu le fragmente, ça peut impacter les réponses DNS surtout en UDP
jean-bigot
Membre depuis le 19/05/2024
pas de service mesh. le MTU... c'est une excellente piste. on a des appliances au milieu qui pourraient avoir un MTU plus petit. je vais tester de forcer le MTU à 1500 sur une instance de test et voir si ça améliore
louis-albert
Membre depuis le 15/06/2024
bien vu le MTU c'est un piège classique. utilise `ping -M do -s 1472` depuis ton pod pour voir si les paquets de 1500 passent sans fragmentation
jean-bigot
Membre depuis le 19/05/2024
OMG c'était bien ça ! Le MTU était à 9001 sur les EKS nodes et notre firewall au milieu le réduisait sans le dire. Forcer 1500 sur les interfaces a réglé le problème de latence DNS. Vous êtes des chefs, thx !