Saltar al contenido
EdgeServers
Blog

Seis fugas de coste en Kubernetes que encontramos en casi todos los clústeres

8 de mayo de 2026 · 2 min de lectura · por Sudhanshu K.

Cada clúster que recibimos tiene las mismas seis fugas de coste. Los números varían; las fugas son las mismas.

1. requests sobredimensionadas

Los desarrolladores establecen requests: 1Gi «por si acaso» y nunca vuelven a bajarlo. El scheduler reserva entonces esa memoria para el pod aunque solo use 80 MB. El Cluster Autoscaler sigue escalando para satisfacer reservas que nadie usa.

Herramientas que ayudan: Vertical Pod Autoscaler (VPA) en modo recommender, KRR (Krr.io), Goldilocks. Elija una, ejecútela una semana, baje las requests contra el uso real p99 + 20 %.

2. Namespaces ociosos sin dueño

El dev-tomas-spike-1, el staging-old, el argocd-test. Cuestan dinero 24/7. Barremos mensualmente con un informe sencillo — namespaces sin actividad de pod en los últimos 14 días — y o bien recuperamos los recursos o los facturamos al equipo propietario.

3. Dispersión de snapshots EBS

Cada clúster que auditamos tiene cientos de snapshots EBS huérfanos — viejos snapshots de PVC, backups ETCD de un clúster que ya no existe, volcados de depuración. aws ec2 describe-snapshots más un filtro de edad suele sacar a la luz 200-2000 $/mes de puro desperdicio.

4. Egress por NAT gateway

Los pods que hablan a S3 vía DNS público pasan por el NAT gateway y pagan egress por GB. La solución son los VPC endpoints para S3 + DynamoDB. Cambio de cinco minutos, a menudo 500-3000 $/mes ahorrados.

5. Mezcla incorrecta de node-pools

Ejecutar todo en m5.large cuando la mitad de las cargas cabría en t3.medium Spot. Karpenter con varios pools (on-demand para stateful, Spot para stateless) suele recortar el cómputo en un 30-40 %.

6. Un loadbalancer por servicio por defecto

Cada type: LoadBalancer aprovisiona un balanceador de nube real a 20+ $/mes. Convierta a un ingress controller compartido (NGINX Ingress, Traefik, AWS ALB Ingress Controller). Un clúster con 30 servicios suele perder 25 LBs.

El post de Medium contiene el script de auditoría que usamos, lo que reportamos mensualmente al cliente, y qué dejamos a ellos arreglar frente a lo que arreglamos en marcha.

Artículo completo disponible

Leer el artículo completo