Skip to main content
この機能は非推奨になりました。詳細はチェンジログを参照してください。
速度と感情の制御は、プレイグラウンド およびテキスト読み上げ (TTS) エンドポイント (BytesSSEWebSocket) の API で利用できます。
コントロールの効果はボイスと原稿によって異なります。 生成された音声にアーティファクト (歪み) が発生する場合は、強度を下げたり、適用するコントロールの数を減らしてみてください。

プレイグラウンド

プレイグラウンドでは、Text-to-Speech タブの「Speed/Emotion」ボタンをクリックすることで、速度と感情のコントロールにアクセスできます。

API

この機能は現在実験的なものであり、互換性のない変更が加えられる可能性があります。
API でコントロールを使用するには、API リクエストの voice オブジェクトに __experimental_controls ディクショナリを追加します。
"voice": {
  "mode": "id",
  "id": "VOICE_ID",
  "__experimental_controls": {
    "speed": "normal",
    "emotion": [
      "positivity:high",
      "curiosity"
    ]
  }
}

速度オプション

  • "slowest": 非常に遅い音声
  • "slow": 通常よりも遅い音声
  • "normal": デフォルトの速度
  • "fast": 通常よりも速い音声
  • "fastest": 非常に速い音声
より細かい制御を行うには、速度を [1.0,1.0][-1.0, 1.0] の範囲内の数値で定義できます。0 はデフォルト速度を表し、負の値で音声が遅くなり、正の値で速くなります。
"__experimental_controls": {
  "speed": "fast"
}

感情オプション

emotion パラメータは、emotion_name:level 形式の「タグ」の配列です。例: positivity:highcuriosity

感情名

  • anger
  • positivity
  • surprise
  • sadness
  • curiosity

感情レベル

感情のコントロールは加算的なものであり、感情を減らしたり取り除いたりすることはできません。 たとえば、anger:low はボイスにわずかな怒りを加えるもので、ボイスから怒りを減らすものではありません。
  • lowest
  • low
  • (中程度の感情の追加にはレベルを省略します)
  • high
  • highest