メインコンテンツへスキップ
ほとんどのお客様にとって、Sonic 3.5 は Sonic 3 のドロップイン置き換えです。既存のボイス ID、リクエスト形式、プロンプトはそのまま動作します。

モデル ID の切り替え

# Previous
model_id = "sonic-3"

# Current
model_id = "sonic-3.5"

Sonic 3.5 の新機能

sonic-3 と比較して:
  • より自然な発話、ペーシング、感情表現。特に表現豊かで会話的、サポート風の原稿でその差が顕著です。
  • すべての言語とボイスで音質が向上しています。
  • 英数字の読み上げが劇的に改善 — 確認コード、注文番号、電話番号、ID、メールアドレスが、サポートされるすべての言語で大幅に自然に聞こえます。
  • 段階的に向上した多言語パフォーマンス。特にヘブライ語、日本語、スペイン語、ヒンディー語、ドイツ語、韓国語、フランス語で顕著です。
  • readbassbow などの英語の異音同綴語が、文脈に応じてより正確に発音されるようになりました。

切り替え前に知っておくべきこと

  • Spell タグの動作は同じです。 すでに <spell>...</spell> で英数字を囲んでいる場合は、何も変更する必要はありません。より良い音質で出力されるだけです。spell タグの代わりに句読点 (カンマ、ピリオド、空白) を使用している場合は、推奨形式が変更されています。プロンプトのヒント を参照してください。
  • タイムスタンプ。 中断処理に使用される単語末のタイムスタンプは変更されていないはずです。単語先頭のタイムスタンプに依存している場合は注意深くテストし、退行が見られればご連絡ください。

最良の結果を得るためのヒント

  • モデルに適切なコンテキストを与えると自然さが向上します。 詳細は バッファリングガイド を参照してください。
  • プロンプトは自然な書き言葉の形のまま維持してください。 強力な前処理 (句読点の除去、すべて大文字化など) は一般的に出力品質を下げます。