Seis vazamentos de custo no Kubernetes que encontramos em quase todo cluster
8 de maio de 2026 · 1 min de leitura · por Sudhanshu K.
Todo cluster que assumimos tem os mesmos seis vazamentos de custo. Os números variam; os vazamentos são os mesmos.
1. requests superdimensionados
Desenvolvedores definem requests: 1Gi «por garantia» e nunca voltam para diminuir. O scheduler então reserva essa memória para o pod mesmo quando ele usa 80 MB. O Cluster Autoscaler continua subindo para satisfazer reservas que ninguém usa.
Ferramentas que ajudam: Vertical Pod Autoscaler (VPA) em modo recommender, KRR (Krr.io), Goldilocks. Escolha uma, rode por uma semana, baixe os requests contra o uso real p99 + 20 %.
2. Namespaces ociosos sem dono
O dev-tomas-spike-1, o staging-old, o argocd-test. Custam dinheiro 24/7. Varremos mensalmente com um relatório simples — namespaces sem atividade de pod nos últimos 14 dias — e ou recuperamos os recursos ou cobramos do time dono.
3. Proliferação de snapshots EBS
Todo cluster que auditamos tem centenas de snapshots EBS órfãos — snapshots antigos de PVC, backups ETCD de um cluster que não existe mais, dumps de debug. aws ec2 describe-snapshots mais um filtro de idade geralmente revela 200-2000 $/mês de puro desperdício.
4. Egress pelo NAT gateway
Pods que falam com S3 via DNS público passam pelo NAT gateway e pagam egress por GB. A correção são VPC endpoints para S3 + DynamoDB. Mudança de cinco minutos, frequentemente 500-3000 $/mês economizados.
5. Mix errado de node-pools
Rodar tudo em m5.large quando metade das cargas caberia em t3.medium Spot. Karpenter com múltiplos pools (on-demand para stateful, Spot para stateless) costuma cortar compute em 30-40 %.
6. Um loadbalancer por serviço por padrão
Cada type: LoadBalancer provisiona um balanceador de nuvem real a 20+ $/mês. Converta para um ingress controller compartilhado (NGINX Ingress, Traefik, AWS ALB Ingress Controller). Um cluster com 30 serviços frequentemente perde 25 LBs.
O post no Medium tem o script de auditoria que usamos, o que reportamos mensalmente ao cliente, e o que deixamos para eles corrigirem versus o que corrigimos em voo.
Full article available
Read the full article