comment reduire les couts s3 analytics ?

bdufour 19/02/2026
RÉSOLU
bdufour
Auteur
Avatar de bdufour
bdufour
Auteur

J'ai une facture AWS S3 qui explose à cause d'Athena. Dès que je lance une requête de monitoring ou de logs, ça me coûte une blinde.

Comment optimiser ça sans supprimer mes données ?

19/02/2026 à 23:05

3 commentaires

Faut pas stocker tes logs en CSV ou JSON brut dans S3. Convertis tout en Parquet et utilise du partitionnement par date dans ton bucket.

CREATE TABLE internal_logs (
  request_id string,
  status int
)
PARTITIONED BY (dt string)
STORED AS PARQUET
LOCATION 's3://my-bucket/logs/';
20/02/2026 à 23:46

Exact, et surtout ajoute une clause WHERE sur tes colonnes de partitionnement pour que Athena ne scanne pas tout le bucket à chaque fois. C'est le volume de données scannées qui te ruine.

22/02/2026 à 16:36
bdufour
Auteur
Avatar de bdufour
bdufour
Auteur

Ok j'ai refait l'ingestion en Parquet avec un partitionnement journalier. La même requête scanne maintenant 100 fois moins de données. C'est parfait merci.

25/02/2026 à 06:08

Laisser une réponse

Vous devez être connecté pour poster un message !

Rejoindre la communauté

Recevoir les derniers articles gratuitement en créant un compte !

S'inscrire