> ## Documentation Index
> Fetch the complete documentation index at: https://docs.cartesia.ai/llms.txt
> Use this file to discover all available pages before exploring further.

# 料金

> Cartesiaの使用量課金の仕組み

Cartesiaは、モデルの使用量を **クレジット** で、エージェントの使用量を **エージェントドル** で計量します。

すべてのサブスクリプションプランには、月間のクレジット割当が含まれています。現在のプランと含まれるクレジットについては、[cartesia.ai/pricing](https://cartesia.ai/pricing) を参照してください。

クレジットは成功したリクエストでのみ消費されます。エラーではクレジットは消費されません。

## 概要

| 機能                  | エンドポイント                                                                                                                                                 | コスト                      |
| ------------------- | ------------------------------------------------------------------------------------------------------------------------------------------------------- | ------------------------ |
| エージェント              | [Line](/line/introduction)                                                                                                                              | クレジットではなくUSDで分単位課金       |
| TTS                 | [`/tts/bytes`](/api-reference/tts/bytes), [`/tts/sse`](/api-reference/tts/sse), [`/tts/websocket`](/api-reference/tts/websocket)                        | 約1文字あたり1クレジット            |
| PVC / Fine-tune TTS | [`/tts/bytes`](/api-reference/tts/bytes), [`/tts/sse`](/api-reference/tts/sse), [`/tts/websocket`](/api-reference/tts/websocket)                        | 約1文字あたり1.5クレジット          |
| STT                 | [`/stt`](/api-reference/stt/transcribe), [`/stt/websocket`](/api-reference/stt/websocket), [`/stt/turns/websocket`](/api-reference/stt/turns/websocket) | エンドポイント、モデル、音声長によって異なります |
| PVC ファインチューニング      | [`/fine-tunes/create`](/api-reference/fine-tunes/create)                                                                                                | ファインチューニング1回あたり100万クレジット |
| Infill              | [`/infill/bytes`](/api-reference/infill/bytes)                                                                                                          | 300クレジット + 1文字あたり約1クレジット |
| Voice Changer       | [`/voice-changer/bytes`](/api-reference/voice-changer/bytes), [`/voice-changer/sse`](/api-reference/voice-changer/sse)                                  | 1秒あたり15クレジット             |

## エージェント

Cartesiaのホスト型 [Line](/line/integrations/overview) ボイスエージェントは、米ドルで分単位で課金されます。これはクレジット残高に影響しません。

| 機能           | 1分あたりの料金 | 備考                          |
| ------------ | -------- | --------------------------- |
| エージェント通話     | \$0.06   | すべてのボイスエージェント通話の基本料金        |
| テレフォニー(アドオン) | +\$0.014 | Cartesia提供の電話番号を使用する場合の追加料金 |

## Text-to-Speech

標準的なTTSは1文字あたり約1クレジットかかります。正確なクレジット数は、トランスクリプトの前処理によりわずかに変動する可能性があります。

これは、すべてのTTSエンドポイントに適用されます: [`/tts/bytes`](/api-reference/tts/bytes)、[`/tts/sse`](/api-reference/tts/sse)、[`/tts/websocket`](/api-reference/tts/websocket)。

### Pro Voice Clone を使用したTTS

[Pro Voice Clone](/build-with-cartesia/capability-guides/clone-voices-pro) で音声を生成すると、1文字あたり約1.5クレジット(標準TTSの50%増し)かかります。これは、お客様のデータでファインチューニングされた専用モデルで実行されるためです。

これは [Instant Voice Clones](/build-with-cartesia/capability-guides/clone-voices) には適用されず、標準レートで課金されます。

## Speech-to-Text

STTの料金は、モデルとバッチエンドポイント/リアルタイムエンドポイントのどちらを使用するかによって異なります。トランスクリプトが生成されなくても、無音区間も含まれます。

| エンドポイント                                                      | `ink-2`       | `ink-whisper` |
| ------------------------------------------------------------ | ------------- | ------------- |
| [`/stt/websocket`](/api-reference/stt/websocket)             | 音声1秒あたり3クレジット | 音声1秒あたり1クレジット |
| [`/stt/turns/websocket`](/api-reference/stt/turns/websocket) | 音声1秒あたり3クレジット | 音声1秒あたり1クレジット |
| [`/stt`](/api-reference/stt/transcribe)                      | まだ利用不可        | 音声2秒あたり1クレジット |

## Pro Voice Clone ファインチューニング

[Pro Voice Clone](/build-with-cartesia/capability-guides/clone-voices-pro) の作成は、[`/fine-tunes/create`](/api-reference/fine-tunes/create) を介してお客様のデータでモデルをファインチューニングするもので、1,000,000クレジットかかります。

トレーニングが成功した場合にのみ課金されます。Pro Voice Cloneはトレーニングされたベースモデルにピン留めされるため、新しいベースモデルや新しいデータでの再トレーニングには、さらに1,000,000クレジットかかります。

## Infill

[Infill](/api-reference/infill/bytes) は、既存の2つのクリップをつなぐ音声を生成します。各リクエストには固定の300クレジットに加えて、Infillトランスクリプトに適用される[標準TTSレート](#text-to-speech)がかかります。

## Voice Changer

Voice Changerは入力音声をターゲットボイスに変換します。[`/voice-changer/bytes`](/api-reference/voice-changer/bytes) および [`/voice-changer/sse`](/api-reference/voice-changer/sse) の両方で、入力音声1秒あたり15クレジットかかります。

## 使用量を確認する

[usageページ](https://play.cartesia.ai/usage) で使用量を確認したり、[サブスクリプションページ](https://play.cartesia.ai/subscription) で現在の残高を確認したりできます。

さらに、[クレジット使用量](/api-reference/usage/credits) および [エージェント使用量](/api-reference/usage/agents) APIを使用して、プログラム的に使用量を確認できます。これには、[admin APIキー](/use-the-api/api-conventions#use-admin-api-keys-for-management-endpoints) の作成が必要です。
