メインコンテンツへスキップ
Sonic は、生成される音声の速度、音量、感情を制御する機能を提供しています。これらは play.cartesia.ai で UI コントロールを使うか、generation_config パラメータを渡すか、原稿内で SSML タグ を使って利用できます。
Sonic はこれらのパラメータを厳密な調整ではなくガイダンスとして解釈します。 これは自然な音声を確保するためです。コンテンツに対してテストを行い、出力が期待どおりであることを確認してください。

速度と音量のコントロール

generation_config.speed および generation_config.volume パラメータで、TTS 生成の速度と音量をガイドします。これらの値はデフォルトに対するおおよその倍率です。たとえば、1.5 はデフォルト速度の 1.5 倍で音声を生成します。
generation_config.speed
number
生成の速度。範囲は 0.6 から 1.5 です。
generation_config.volume
number
生成の音量。範囲は 0.5 から 2.0 です。
これらは原稿の中で SSML を使って指定することもできます。
<speed ratio="1.5"/> I like to speak quickly because it makes me sound smart.
<volume ratio="1.5"/> And I can be loud, too!

感情コントロール Beta

デフォルトでは、モデルは与えられた原稿の感情的なサブテキストを解釈します。generation_config.emotion パラメータを使用して、ディレクターが俳優を演出するように TTS 生成の感情をガイドできます。
感情タグはモデルをより感情豊かにする方向にプッシュしますが、感情が原稿と一貫している場合にのみ機能します。以下のようなミスマッチはうまく機能しない可能性が高いです:
<emotion value="sad"/> I'm so excited!
generation_config.emotion
string
生成の感情ガイダンス。下記の感情のいずれかです。
最もデータが豊富で最良の結果を生み出す主要な感情は、neutralangryexcitedcontentsadscared です。 利用可能な感情の完全なリストは次のとおりです: happyexcitedenthusiasticelatedeuphorictriumphantamazedsurprisedflirtatiousjoking/comediccuriouscontentpeacefulserenecalmgratefulaffectionatetrustsympatheticanticipationmysteriousangrymadoutragedfrustratedagitatedthreateneddisgustedcontemptenvioussarcasticironicsaddejectedmelancholicdisappointedhurtguiltyboredtiredrejectednostalgicwistfulapologetichesitantinsecureconfusedresignedanxiouspanickedalarmedscaredneutralproudconfidentdistantskepticalcontemplativedetermined 感情表現が最も優れているボイスは次のとおりです。
  • Leo (id: 0834f3df-e650-4766-a20c-5a93a43aa6e3)
  • Jace (id: 6776173b-fd72-460d-89b3-d85812ee518d)
  • Kyle (id: c961b81c-a935-4c17-bfb3-ba2239de8c2f)
  • Gavin (id: f4a3a8e4-694c-4c45-9ca0-27caf97901b5)
  • Maya (id: cbaf8084-f009-4838-a096-07ee2e6612b1)
  • Tessa (id: 6ccbfb76-1fc6-48f7-b71d-91ac6298247b)
  • Dana (id: cc00e582-ed66-4004-8336-0175b85c85f6)
  • Marian (id: 26403c37-80c1-4a1a-8692-540551ca2ae5)
感情豊かなボイスの全リストは Voice Library で確認できます。 感情には SSML タグを使用することもできます。
<emotion value="angry"/> How dare you speak to me like I'm just a robot!

非言語表現

原稿に [laughter] を挿入すると、モデルを笑わせることができます。