Explosion des coûts Egress sur GCP inter-régions

Posté par bjean le 03/05/2025
RÉSOLU

bjean

Membre depuis le 22/11/2018

yo la team finops on a un souci avec notre facture GCP du mois dernier. les coûts d'egress inter-régions ont explosé de 200% on comprend pas pourquoi. on a nos services en `europe-west1` qui appellent des services de données en `europe-west3` mais d'habitude c'est stable

on a pas changé grand chose dans le code ou l'infra. juste des mises à jour de quelques libs et des déploiements classiques. mais rien qui justifie un x3 sur l'egress. comment on peut debug ça proprement sur GCP ? les outils de facturation c'est pas super précis

Commentaires

sdesousa

Membre depuis le 01/09/2024

hmm egress inter-régions ça sent le data transfer entre zones ou régions. t'as checké les logs de tes load balancers ou proxys inversés si y'en a ? des fois une mauvaise config redirige tout le trafic vers une région lointaine avant de revenir

margaret04

Membre depuis le 07/03/2019

regarde le Network Intelligence Center sur GCP. ça te donne des graphes et des logs sur le trafic réseau. tu peux filtrer par projet par région. ça va te montrer d'où vient le trafic qui coûte cher

bjean

Membre depuis le 22/11/2018

ok je vais voir ça pour le Network Intelligence Center. on n'a pas de LB entre les services c'est du direct via l'IP privée des GKE pods

sdesousa

Membre depuis le 01/09/2024

ip privée des gke pods qui appellent des services de données dans une autre région ? comment ça ? vous utilisez des private service connect ou des vpn pour ça ? ou c'est des ips publiques par accident ?

bjean

Membre depuis le 22/11/2018

non non c des VPC peering entre les régions. c pour ça que d'habitude c stable et pas cher. c sensé être du trafic inter-vpc en interne

margaret04

Membre depuis le 07/03/2019

vpc peering c cool mais ça reste inter-région et ça coûte cher si le volume est gros. le prix varie pas mal. 0.01$/gb je crois entre eu-west1 et eu-west3

t'as pas un bug de cache ou un truc qui fait que tes applis re-téléchargent des grosses bases de données à chaque démarrage ou à chaque requête ? un genre de cache invalidation violent

bjean

Membre depuis le 22/11/2018

putain mais oui ! j'ai eu une idée. on a mis à jour une librairie de notre ORM et elle a un mode "lazy loading" par défaut sur certaines relations qui avant étaient eager. elle fait des requêtes N+1 et recharge des gros blobs de données à chaque appel

et ces blobs sont stockés sur un Cloud Storage dans eu-west3. avant c'était pas chargé du tout

sdesousa

Membre depuis le 01/09/2024

HA. bingo. classic. une petite modif de lib et hop la facture décolle. c ça le finops. faut traquer les appels réseau

le network intelligence center va te confirmer ça avec les débits sortants de tes gke pods vers cloud storage en eu-west3

bjean

Membre depuis le 22/11/2018

ouais je viens de regarder. c'est exactement ça. des téraoctets qui partent des GKE vers GCS. c'est le lazy loading du ORM. on va le désactiver ou le reconfigurer. putain merci les gars le Network Intelligence Center m'a donné les métriques pour le prouver

margaret04

Membre depuis le 07/03/2019

good job. ces coûts d'egress c'est le piège numéro un en cloud. surtout entre régions ou vers internet. faut toujours être vigilant

Laisser une réponse

Vous devez être connecté pour poster un message !

Rejoindre la communauté

Recevoir les derniers articles gratuitement en créant un compte !

S'inscrire