> ## Documentation Index
> Fetch the complete documentation index at: https://docs.cartesia.ai/llms.txt
> Use this file to discover all available pages before exploring further.

# オートスケーリング

## Pod オートスケーリング (KEDA)

KEDA の ScaledObjects は、2 つのトリガーを持つ Prometheus ベースのメトリクスを使用します:

| トリガー        | メトリック                                             | しきい値      | 条件                    |
| ----------- | ------------------------------------------------- | --------- | --------------------- |
| Worker Load | inferno\_worker\_load / inferno\_worker\_capacity | 0.8 (80%) | 常に有効                  |
| Queue-based | api\_queue\_size / capacity (overflow モード)        | 1.0       | `minReplicas=0` のときのみ |
| Queue-based | api\_unserviceable\_requests\_size                | 0.9       | `minReplicas=0` のときのみ |

スケーリング動作:

* ポーリング間隔: 15 秒
* スケールアップの安定化時間: 30 秒
* スケールダウンの安定化時間: 900 秒（15 分）
* スケールダウンポリシー: 60 秒ごとに Pod を 1 つ削除

## クラスタ／ノードのオートスケーリング

<Tabs>
  <Tab title="AWS EKS">
    Cluster Autoscaler を使用:

    * スキャン間隔: 10 秒
    * スケールダウン遅延: ノード追加後 10 分
    * スケールダウンに必要な未使用時間: 10 分
    * Expander: least-waste（bin-packing）
    * メトリック: リソース不足によりスケジュールできない Pending Pod
  </Tab>

  <Tab title="GCP GKE">
    ネイティブ Autoscaler を使用:

    * プロファイル: BALANCED
    * リソース上限: CPU (1〜128)、Memory (1〜512GB)、nvidia-l4 GPU (0〜8)
    * メトリック: Pending Pod + リソース使用率
  </Tab>
</Tabs>

## スケーリングに使用するメトリクス

上記のオートスケーリングトリガーは、アプリケーションが公開する [Prometheus メトリクス](/self-hosted/metrics) を使用します。利用可能なメトリクスの全リストは [メトリクスとモニタリング](/self-hosted/metrics) ページを参照してください。