generation_config パラメータを渡すか、原稿内で SSML タグ を使って利用できます。
速度と音量のコントロール
generation_config.speed および generation_config.volume パラメータで、TTS 生成の速度と音量をガイドします。これらの値はデフォルトに対するおおよその倍率です。たとえば、1.5 はデフォルト速度の 1.5 倍で音声を生成します。
生成の速度。範囲は
0.6 から 1.5 です。生成の音量。範囲は
0.5 から 2.0 です。感情コントロール Beta
デフォルトでは、モデルは与えられた原稿の感情的なサブテキストを解釈します。generation_config.emotion パラメータを使用して、ディレクターが俳優を演出するように TTS 生成の感情をガイドできます。
感情タグはモデルをより感情豊かにする方向にプッシュしますが、感情が原稿と一貫している場合にのみ機能します。以下のようなミスマッチはうまく機能しない可能性が高いです:
生成の感情ガイダンス。下記の感情のいずれかです。
neutral、angry、excited、content、sad、scared です。
利用可能な感情の完全なリストは次のとおりです: happy、excited、enthusiastic、elated、euphoric、triumphant、amazed、surprised、flirtatious、joking/comedic、curious、content、peaceful、serene、calm、grateful、affectionate、trust、sympathetic、anticipation、mysterious、angry、mad、outraged、frustrated、agitated、threatened、disgusted、contempt、envious、sarcastic、ironic、sad、dejected、melancholic、disappointed、hurt、guilty、bored、tired、rejected、nostalgic、wistful、apologetic、hesitant、insecure、confused、resigned、anxious、panicked、alarmed、scared、neutral、proud、confident、distant、skeptical、contemplative、determined。
感情表現が最も優れているボイスは次のとおりです。
- Leo (id:
0834f3df-e650-4766-a20c-5a93a43aa6e3) - Jace (id:
6776173b-fd72-460d-89b3-d85812ee518d) - Kyle (id:
c961b81c-a935-4c17-bfb3-ba2239de8c2f) - Gavin (id:
f4a3a8e4-694c-4c45-9ca0-27caf97901b5) - Maya (id:
cbaf8084-f009-4838-a096-07ee2e6612b1) - Tessa (id:
6ccbfb76-1fc6-48f7-b71d-91ac6298247b) - Dana (id:
cc00e582-ed66-4004-8336-0175b85c85f6) - Marian (id:
26403c37-80c1-4a1a-8692-540551ca2ae5)
非言語表現
原稿に[laughter] を挿入すると、モデルを笑わせることができます。