オートスケーリング

Pod オートスケーリング (KEDA)

KEDA の ScaledObjects は、2 つのトリガーを持つ Prometheus ベースのメトリクスを使用します:

トリガー	メトリック	しきい値	条件
Worker Load	inferno_worker_load / inferno_worker_capacity	0.8 (80%)	常に有効
Queue-based	api_queue_size / capacity (overflow モード)	1.0	`minReplicas=0` のときのみ
Queue-based	api_unserviceable_requests_size	0.9	`minReplicas=0` のときのみ

スケーリング動作:

Cluster Autoscaler を使用:

上記のオートスケーリングトリガーは、アプリケーションが公開する Prometheus メトリクスを使用します。利用可能なメトリクスの全リストはメトリクスとモニタリングページを参照してください。