メインコンテンツへスキップ

Pod オートスケーリング (KEDA)

KEDA の ScaledObjects は、2 つのトリガーを持つ Prometheus ベースのメトリクスを使用します:
トリガーメトリックしきい値条件
Worker Loadinferno_worker_load / inferno_worker_capacity0.8 (80%)常に有効
Queue-basedapi_queue_size / capacity (overflow モード)1.0minReplicas=0 のときのみ
Queue-basedapi_unserviceable_requests_size0.9minReplicas=0 のときのみ
スケーリング動作:
  • ポーリング間隔: 15 秒
  • スケールアップの安定化時間: 30 秒
  • スケールダウンの安定化時間: 900 秒(15 分)
  • スケールダウンポリシー: 60 秒ごとに Pod を 1 つ削除

クラスタ/ノードのオートスケーリング

Cluster Autoscaler を使用:
  • スキャン間隔: 10 秒
  • スケールダウン遅延: ノード追加後 10 分
  • スケールダウンに必要な未使用時間: 10 分
  • Expander: least-waste(bin-packing)
  • メトリック: リソース不足によりスケジュールできない Pending Pod

スケーリングに使用するメトリクス

上記のオートスケーリングトリガーは、アプリケーションが公開する Prometheus メトリクス を使用します。利用可能なメトリクスの全リストは メトリクスとモニタリング ページを参照してください。