サブスクリプションプランごとの同時実行制限
サブスクリプションプランによって、同時に処理できるリクエスト数が決まります。Sonic テキスト読み上げ (TTS) と Ink 音声認識 (STT) はそれぞれ別々の同時実行制限を持ち、プランごとの値は同じです。| プラン | TTS 同時リクエスト数 | STT 同時リクエスト数 |
|---|---|---|
| Free | 2 | 8 |
| Pro | 3 | 12 |
| Startup | 5 | 20 |
| Scale | 15 | 60 |
| Enterprise | カスタム | カスタム |
Sonic(テキスト読み上げ)と Ink(音声認識)のサービスは、それぞれ別個の同時リクエスト制限を持ちます。たとえば、Scale プランの場合、最大 15 件の同時 TTS リクエストと、それとは別に 60 件の同時 STT リクエストを同時実行できます。
テキスト読み上げ (TTS) の同時実行
TTS の生成同時実行は、ある時点でアクティブな一意のコンテキスト数で測定します。- HTTP エンドポイントでは、各リクエストが別個のコンテキストとして扱われ、同時実行制限にカウントされます。
- WebSocket では、一意の
context_idがコンテキストを定義します。同じcontext_idで追加リクエストを送信しても、同時実行使用量は増加しません。同じコンテキストへのリクエストは順次処理されるためです。 - STT は TTS の同時実行制限にカウントされません。
429 Too Many Requests エラーが返されます。同時実行制限の確認とアップグレードは、プレイグラウンドの play.cartesia.ai で行えます。
TTS 同時実行制限の解釈
TTS 同時実行制限の解釈は、Sonic モデルファミリーの使い方によって異なります。会話型ユースケース
会話型ユースケース
ボイスエージェントなどリアルタイム会話型ユースケースでは、サポートできる並列会話数は実質的に同時実行制限の 4 倍であることがわかっています。これは目安に過ぎず、サポートする会話の種類によって異なります。具体的なユースケースについてはお問い合わせください。たとえば TTS 同時実行制限が 15 の場合、通常 60 件の並列会話をサポートできます。
非会話型ユースケース
非会話型ユースケース
バッチジョブでの音声生成など、非会話型ユースケースでは、同時実行制限とサポートできる並列生成数の間により直接的な関係があります。たとえば TTS 同時実行制限が 15 の場合、通常 15 件の並列 TTS 生成をサポートできます。同時実行制限を超えないように接続プールを使用できます。
TTS WebSocket 制限
並列 TTS WebSocket 接続数は、同時実行制限の 10 倍に制限されます。たとえば同時実行制限が 15 の場合、最大 150 個の並列 TTS WebSocket 接続を持てます。 WebSocket 制限を超えると、新しい WebSocket 接続を開こうとした際に429 Too Many Requests エラーが返されます。
通常、ユーザーが(スケール時でも)TTS WebSocket 制限に達するのは、アイドル接続を適切にクローズしていないためです。アイドル接続のクローズに加え、接続プールを作成して WebSocket 制限を超えないようにすることもできます。
TTS WebSocket タイムアウト
アイドル状態の TTS WebSocket 接続は 5 分後にクローズされます。接続が長時間アイドル状態になる場合は、クローズして新しい WebSocket 接続を開き直すことを推奨します。音声認識 (STT) の同時実行
各アクティブな文字起こしストリームは、HTTP か WebSocket かに関わらず、1 つの同時リクエストとしてカウントされます。- 各同時 HTTP または WebSocket 接続は STT 同時実行制限にカウントされます
- アイドル状態の STT WebSocket も STT 同時実行制限にカウントされます
- TTS は STT 同時実行制限にカウントされません
429 Too Many Requests エラーが返されます。