Skip to main content
アカウントには 2 種類のレート制限が適用されます: WebSocket 制限と生成同時実行制限です。

サブスクリプションプランごとの同時実行制限

サブスクリプションプランによって、同時に処理できるリクエスト数が決まります。Sonic テキスト読み上げ (TTS) と Ink 音声認識 (STT) はそれぞれ別々の同時実行制限を持ち、プランごとの値は同じです。
プランTTS 同時リクエスト数STT 同時リクエスト数
Free28
Pro312
Startup520
Scale1560
Enterpriseカスタムカスタム
Sonic(テキスト読み上げ)と Ink(音声認識)のサービスは、それぞれ別個の同時リクエスト制限を持ちます。たとえば、Scale プランの場合、最大 15 件の同時 TTS リクエストと、それとは別に 60 件の同時 STT リクエストを同時実行できます。

テキスト読み上げ (TTS) の同時実行

TTS の生成同時実行は、ある時点でアクティブな一意のコンテキスト数で測定します。
  • HTTP エンドポイントでは、各リクエストが別個のコンテキストとして扱われ、同時実行制限にカウントされます。
  • WebSocket では、一意の context_id がコンテキストを定義します。同じ context_id で追加リクエストを送信しても、同時実行使用量は増加しません。同じコンテキストへのリクエストは順次処理されるためです。
  • STT は TTS の同時実行制限にカウントされません
TTS の同時実行制限を超えると、429 Too Many Requests エラーが返されます。同時実行制限の確認とアップグレードは、プレイグラウンドの play.cartesia.ai で行えます。

TTS 同時実行制限の解釈

TTS 同時実行制限の解釈は、Sonic モデルファミリーの使い方によって異なります。
ボイスエージェントなどリアルタイム会話型ユースケースでは、サポートできる並列会話数は実質的に同時実行制限の 4 倍であることがわかっています。これは目安に過ぎず、サポートする会話の種類によって異なります。具体的なユースケースについてはお問い合わせください。たとえば TTS 同時実行制限が 15 の場合、通常 60 件の並列会話をサポートできます。
バッチジョブでの音声生成など、非会話型ユースケースでは、同時実行制限とサポートできる並列生成数の間により直接的な関係があります。たとえば TTS 同時実行制限が 15 の場合、通常 15 件の並列 TTS 生成をサポートできます。同時実行制限を超えないように接続プールを使用できます。

TTS WebSocket 制限

並列 TTS WebSocket 接続数は、同時実行制限の 10 倍に制限されます。たとえば同時実行制限が 15 の場合、最大 150 個の並列 TTS WebSocket 接続を持てます。 WebSocket 制限を超えると、新しい WebSocket 接続を開こうとした際に 429 Too Many Requests エラーが返されます。 通常、ユーザーが(スケール時でも)TTS WebSocket 制限に達するのは、アイドル接続を適切にクローズしていないためです。アイドル接続のクローズに加え、接続プールを作成して WebSocket 制限を超えないようにすることもできます。

TTS WebSocket タイムアウト

アイドル状態の TTS WebSocket 接続は 5 分後にクローズされます。接続が長時間アイドル状態になる場合は、クローズして新しい WebSocket 接続を開き直すことを推奨します。

音声認識 (STT) の同時実行

各アクティブな文字起こしストリームは、HTTP か WebSocket かに関わらず、1 つの同時リクエストとしてカウントされます。
  • 各同時 HTTP または WebSocket 接続は STT 同時実行制限にカウントされます
  • アイドル状態の STT WebSocket も STT 同時実行制限にカウントされます
  • TTS は STT 同時実行制限にカウントされません
STT 同時実行制限を超えると、429 Too Many Requests エラーが返されます。

STT WebSocket タイムアウト

アイドル状態の STT WebSocket 接続は 3 分後にクローズされます。接続が長時間アイドル状態になる場合は、クローズして新しい WebSocket 接続を開き直すことを推奨します。