> ## Documentation Index
> Fetch the complete documentation index at: https://docs.cartesia.ai/llms.txt
> Use this file to discover all available pages before exploring further.

# 同時実行と WebSocket の制限

> Cartesia API の同時実行制限とタイムアウトについて学びます。

アカウントには 2 種類のレート制限が適用されます: WebSocket 制限と生成同時実行制限です。

## サブスクリプションプランごとの同時実行制限

サブスクリプションプランによって、同時に処理できるリクエスト数が決まります。Sonic テキスト読み上げ (TTS) と Ink 音声認識 (STT) はそれぞれ別々の同時実行制限を持ち、プランごとの値は同じです。

| プラン        | TTS 同時リクエスト数 | STT 同時リクエスト数 |
| ---------- | ------------ | ------------ |
| Free       | 2            | 8            |
| Pro        | 3            | 12           |
| Startup    | 5            | 20           |
| Scale      | 15           | 60           |
| Enterprise | カスタム         | カスタム         |

<Note>
  Sonic（テキスト読み上げ）と Ink（音声認識）のサービスは、それぞれ別個の同時リクエスト制限を持ちます。たとえば、Scale プランの場合、最大 15 件の同時 TTS リクエストと、それとは別に 60 件の同時 STT リクエストを同時実行できます。
</Note>

## テキスト読み上げ (TTS) の同時実行

TTS の生成同時実行は、ある時点でアクティブな一意のコンテキスト数で測定します。

* HTTP エンドポイントでは、各リクエストが別個のコンテキストとして扱われ、同時実行制限にカウントされます。
* WebSocket では、一意の <code>context\_id</code> がコンテキストを定義します。同じ <code>context\_id</code> で追加リクエストを送信しても、同時実行使用量は増加しません。同じコンテキストへのリクエストは順次処理されるためです。
* STT は TTS の同時実行制限に**カウントされません**。

TTS の同時実行制限を超えると、`429 Too Many Requests` エラーが返されます。同時実行制限の確認とアップグレードは、プレイグラウンドの [play.cartesia.ai](https://play.cartesia.ai) で行えます。

### TTS 同時実行制限の解釈

TTS 同時実行制限の解釈は、Sonic モデルファミリーの使い方によって異なります。

<AccordionGroup>
  <Accordion title="会話型ユースケース">
    ボイスエージェントなどリアルタイム会話型ユースケースでは、サポートできる並列会話数は実質的に同時実行制限の 4 倍であることがわかっています。これは目安に過ぎず、サポートする会話の種類によって異なります。具体的なユースケースについてはお問い合わせください。

    たとえば TTS 同時実行制限が 15 の場合、通常 60 件の並列会話をサポートできます。
  </Accordion>

  <Accordion title="非会話型ユースケース">
    バッチジョブでの音声生成など、非会話型ユースケースでは、同時実行制限とサポートできる並列生成数の間により直接的な関係があります。

    たとえば TTS 同時実行制限が 15 の場合、通常 15 件の並列 TTS 生成をサポートできます。同時実行制限を超えないように接続プールを使用できます。
  </Accordion>
</AccordionGroup>

### TTS WebSocket 制限

並列 TTS WebSocket 接続数は、同時実行制限の 10 倍に制限されます。たとえば同時実行制限が 15 の場合、最大 150 個の並列 TTS WebSocket 接続を持てます。

WebSocket 制限を超えると、新しい WebSocket 接続を開こうとした際に `429 Too Many Requests` エラーが返されます。

通常、ユーザーが（スケール時でも）TTS WebSocket 制限に達するのは、アイドル接続を適切にクローズしていないためです。アイドル接続のクローズに加え、接続プールを作成して WebSocket 制限を超えないようにすることもできます。

### TTS WebSocket タイムアウト

アイドル状態の TTS WebSocket 接続は 5 分後にクローズされます。接続が長時間アイドル状態になる場合は、クローズして新しい WebSocket 接続を開き直すことを推奨します。

## 音声認識 (STT) の同時実行

各アクティブな文字起こしストリームは、HTTP か WebSocket かに関わらず、1 つの同時リクエストとしてカウントされます。

* 各同時 HTTP または WebSocket 接続は STT 同時実行制限にカウントされます
* アイドル状態の STT WebSocket も STT 同時実行制限にカウントされます
* TTS は STT 同時実行制限に**カウントされません**

STT 同時実行制限を超えると、`429 Too Many Requests` エラーが返されます。

### STT WebSocket タイムアウト

アイドル状態の STT WebSocket 接続は 3 分後にクローズされます。接続が長時間アイドル状態になる場合は、クローズして新しい WebSocket 接続を開き直すことを推奨します。
