Membre depuis le 12/03/2019
yo ! première chose à faire, active les logs d'accès sur tes buckets s3 si c'est pas déjà fait. ça va te donner une idée de qui (adresses ip, user-agents) et quand accède à tes objets. ça aide à identifier un pattern ou un abus.
Membre depuis le 18/04/2020
T'aurais pas activé la réplication cross-region (CRR) sur un bucket par accident? Ou tu partages des buckets avec d'autres comptes AWS et y a eu une hausse de pull de leur côté? La CRR, ça coûte en transfert de données.
Membre depuis le 12/03/2019
Est-ce que tu utilises CloudFront ou un autre CDN devant S3? Si non, le trafic sort directement de S3 et c'est beaucoup plus cher. Si oui, vérifie que ton CDN est bien configuré pour servir le max de requêtes et pas refetch trop souvent de S3.
Membre depuis le 17/06/2024
Des applications externes, des partenaires, ou même des services d'analytics qui pullent des données de tes buckets? J'ai déjà vu des coûts exploser parce qu'un service tiers s'est mis à aspirer des volumes dingues.
Membre depuis le 18/04/2020
Tes buckets sont-ils publics? Même si c'est pour des assets web, des bots ou des scrapers malveillants peuvent pomper beaucoup de données sans que tu le saches si t'as pas de restrictions. Regarde les User-Agents dans les logs d'accès.
Membre depuis le 12/03/2019
Regarde tes logs DNS aussi. Si des services résolvent tes endpoints S3 directement et contournent CloudFront (si tu en as un), c'est du coût Egress S3 direct. Un service interne mal configuré ou un dev qui teste un truc en direct.
Membre depuis le 17/06/2024
Un ETL (Extract Transform Load) mal configuré qui loop ou qui re-télécharge les mêmes données sans caching? Ça peut vider un bucket rapidement en data egress.
Membre depuis le 18/04/2020
Vérifie les métriques S3 `BytesDownloaded` par bucket dans CloudWatch. Ça te donnera une granularité au niveau du bucket pour voir lequel est la source du problème.
Membre depuis le 12/03/2019
Si c'est des fichiers de backup, est-ce que tu aurais passé un bucket en S3 Glacier ou Infrequent Access récemment? Les coûts de récupération peuvent être très élevés si tu tires beaucoup de données de ces classes de stockage.
Membre depuis le 17/06/2024
Audit les IAM roles et policies sur tes buckets S3. Peut-être une nouvelle permission a été ajoutée qui permet à un service ou un user de pull des données qu'il ne devrait pas.
Membre depuis le 12/03/2019
Et enfin, une Lambda ou un autre service qui télécharge des objets d'un bucket puis les re-upload dans un autre bucket sans passer par un bon cache ou une optimisation? J'ai vu des choses étranges avec des Lambdas s'auto-déclenchant.
Membre depuis le 15/04/2019
Un immense merci à tous pour les pistes ! C'était un combo de plusieurs trucs. Un de nos buckets publics était la cible d'un bot scraper qui aspirait nos assets statiques. Et on avait aussi un vieux script de backup qui rapatriait tout en on-prem toutes les nuits sans compression ni déduplication. J'ai activé CloudFront et mis des restrictions IP/user-agent sur les buckets critiques. Le coût devrait redescendre !
Vous devez être connecté pour poster un message !
Recevoir les derniers articles gratuitement en créant un compte !
S'inscrire
joseph65
Membre depuis le 15/04/2019
salut la gang ! on a eu une mauvaise surprise sur la dernière facture aws : le coût de data transfer out de s3 a doublé sans raison apparente. on n'a pas déployé de nouvelles applications, pas de gros changements côté infra. nos buckets s3 hébergent des assets statiques pour nos front-ends et quelques backups. c'est du s3 standard. je comprends pas d'où vient cette hausse soudaine.
Avant on était vers 20TB pour $1800. Quelqu'un a une idée de comment debug ça ?