5 commentaires
yep j'ai déjà vu ça. t'as combien de réplicas coredns ? et est-ce que tu as des limites de cpu/mémoire sur tes pods coredns qui pourraient les étrangler ? check kubectl top pod -n kube-system et les événements sur les pods coredns
et quelles sont tes upstream resolvers dans la config coredns ? si c'est les dns d'aws (amazon-provided dns) ça peut être eux qui ont des moments de faiblesse. ou si t'as une config spécifique pour le résolveur de la vpc. regarde les logs de coredns avec log et debug activés pour voir le temps de réponse des upstreams
ah et j'y pense t'as pas des pods qui font des requêtes dns pour des noms qui n'existent pas ? ça peut générer du trafic inutile et ralentir. aussi regarde la config ndots dans ton /etc/resolv.conf des pods. un ndots:5 peut être très lent car ça essaie plein de domaines avant d'aller chercher au bon endroit
bingo ! ndots:5 dans le resolv.conf par défaut des pods et 2 réplicas coredns seulement. on a 100 noeuds... j'ai mis à jour le coredns configmap pour ajouter l'autoscaling horizontal et j'ai corrigé ndots pour les nouveaux deployments. la latence est revenue à la normale. gros merci à tous !
Laisser une réponse
Vous devez être connecté pour poster un message !
Salut à tous ! j'ai un souci de perfs dns sur mon cluster eks. les requêtes dns depuis mes pods prennent 100-200ms alors que d'habitude c'est 1-2ms. ça arrive de façon intermittente et pas forcément quand le cluster est surchargé. coredns tourne bien j'ai pas d'erreurs dans les logs. une idée de piste ?