sonic-2-2025-04-16 における既存APIのアップデート
sonic-2-2025-04-16 以降、以下のサポートを廃止します:
- Embeddings
stabilityクローニングモード- 速度と感情を調整するための実験的コントロール
similarity クローニングモードが stability クローニングよりも劇的に優れており、
安定性に関する課題も解決しました。stability モードを使用する意義はもはやないため、
削除しました。
速度と感情の実験的コントロールは、実際にはモデルの安定性に悪影響を及ぼします。今後のモデル
バージョンで、より安定的かつ効果的な方法でこれらのコントロールを追加すべく取り組んでいます。
Sonic 2.0 で速度と感情を制御するには、Instant Voice Cloning を使用して、希望する変更を加えた
新しいボイスを作成することをお勧めします。例えば、FFMPEG でボイスを速くしたり遅くしたり、
Voice Changer を使用してボイスの感情豊かなバージョンを作成したり、sonic-2-2025-03-07 で
embeddings から生成されたボイスのインスタントクローンを作成したりできます。
どうしても embeddings や実験的コントロールが必要なユーザーは、APIバージョン 2024-11-13 と
モデルID sonic-2-2025-03-07 を使用してください(どちらも引き続き利用可能です)。ただし、
これらの機能はそのモデルでもモデルの安定性を低下させる可能性があることにご注意ください。
具体的なAPIの変更点:
sonic-2およびsonic-2-2025-04-16は、TTS生成で使用される実験的コントロールを無視します- ボイスクローニングは
similarityクローンのみをサポートします — この手法はsonic-2モデル全般で最高のパフォーマンスを発揮します。 - すべてのエンドポイントから embeddings を削除しました。
- ボイスはボイスIDでのみ指定可能です
/tts生成はボイスembeddingsで呼び出せません
/voices/createおよび/voices/mixを非推奨化しました