👁 Автоматическое масштабирование позволяет динамично адаптировать количество реплик приложения в зависимости от нагрузки, что особенно актуально в условиях изменений в трафике и запросах. В Kubernetes для этого можно настроить Horizontal Pod Autoscaler, который будет автоматически увеличивать или уменьшать количество подов.
📝 Пример для подов в Kubernetes:
apiVersion: autoscaling/v2
kind: HorizontalPodAutoscaler
metadata:
name: my-app-hpa
spec:
scaleTargetRef:
apiVersion: apps/v1
kind: Deployment
name: my-app
minReplicas: 2
maxReplicas: 10
metrics:
- type: Resource
resource:
name: cpu
targetAverageUtilization: 80
📌 Как это работает:
- Этот манифест создает
HorizontalPodAutoscalerдля вашего приложения (my-app), которое будет автоматически масштабироваться в пределах от 2 до 10 реплик. - Масштабирование происходит на основе использования ресурсов, в данном примере по метке нагрузки на процессор (CPU), если средняя нагрузка превышает 80%.
- Kubernetes сам решает, когда и сколько подов запустить, чтобы снизить нагрузку на текущие реплики.
❗️ Эта настройка позволяет автоматически реагировать на повышение или снижение нагрузки, что повышает отказоустойчивость приложения и значительно упрощает управление в больших инфраструктурах.
tags: #k8s #полезно #devops



