/metrics からスクレイプされます。
Prometheus メトリクス
| メトリック名 | 発行元 | 説明 | 通常レンジ |
|---|---|---|---|
inferno_worker_load | ワーカー Pod | ワーカーが現在処理中の同時チャンク数 | < Capacity |
inferno_worker_capacity | ワーカー Pod | ワーカーが処理可能な同時チャンク数 | ハードウェア 依存 |
inferno_worker_ttfa | ワーカー Pod(TTS のみ) | Time to First Audio | < 200 ms |
inferno_worker_rtf | ワーカー Pod | リアルタイムファクター | < 1 |
api_queue_size | API サーバー Pod | オファリングごとのリクエストキューサイズ | Low |
api_unserviceable_requests_size | API サーバー Pod | 処理不能リクエスト数 | 0 |