sonic-2 と sonic-turbo は、すべての言語で MFA スタイルの IPA を使用します。
発音の制御性を最大限に高めたい場合は、sonic-2 の使用を推奨します。
旧 Sonic モデルでもカスタム発音を利用できます。
sonic、sonic-2024-12-12、sonic-2024-10-19 の各モデルは、英語に対して Sonic 独自の IPA 音素を使用します。
sonic と sonic-2024-12-12 は英語以外の言語に対して MFA スタイルの IPA を使用し、Sonic Preview モデルはすべての言語で MFA スタイルの IPA を使用します。
なお、sonic-2024-10-19 は英語以外の言語のカスタム発音をサポートしません。
すべてのモデルを近日中に MFA スタイルの IPA に更新する予定です。
カスタム単語は二重山括弧 << >> で囲み、音素間にはパイプ文字 | を入れ、空白は入れないでください。
例:
Can I get <<x|a|l|a|p|e|ɲ|o>> on that?(MFA スタイル IPA)Can I get <<h|ɑː|l|ˈə|p|eɪ|n|y|ˌoʊ|>> on that?(Sonic 独自 IPA)
MFA スタイル IPA
発音の構築
Montreal Forced Aligner で定義されている IPA 音素セットを使用しています。この音素セットはサイズが大きく複雑なため、既知の音素化を持つ既存の単語から始めてカスタム発音を構築する方が簡単かもしれません。単語のカスタム発音を構築する際の推奨ワークフローは次のとおりです。- MFA 発音辞書のインデックス に移動し、対象の言語のページを探します。音素セットが MFA であることを確認し、最新バージョン (ほとんどの言語では v3.0 または v3.1) をダウンロードしてください。
- このページの “phones” セクションに、対象言語で許容される音素の全範囲が表示されます。
Installationセクションまでスクロールし、Download from the release pageリンクをクリックします。- リリースページの一番下までスクロールして .dict ファイルをダウンロードします。これは単語をその構成音素にマッピングするテキストファイルです。
- ファイルの最初の列に単語があり、最後の列に空白区切りの音素があります。その他の列は無視してください。
- 辞書内で対象の単語、または意図する発音に似た単語を検索します。これらの発音を出発点としてカスタム発音を構築します。
例
「This is a generation from Cartesia」というテキストを生成したいときに、モデルが「Cartesia」を正しく発音しないとします。次の手順を行います。-
MFA 発音辞書のインデックス に移動し、英語の発音辞書を探します。US 英語の場合、最新のバージョンは v3.1 です。
- ページには、US 英語で許容される音素は
aj aw b bʲ c cʰ cʷ d dʒ dʲ d̪ ej f fʲ h i iː j k kʰ kʷ l m mʲ m̩ n n̩ ow p pʰ pʲ pʷ s t tʃ tʰ tʲ tʷ t̪ v vʲ w z æ ç ð ŋ ɐ ɑ ɑː ɒ ɒː ɔj ə ɚ ɛ ɝ ɟ ɟʷ ɡ ɡʷ ɪ ɫ ɫ̩ ɱ ɲ ɹ ɾ ɾʲ ɾ̃ ʃ ʉ ʉː ʊ ʎ ʒ ʔ θであると書かれています。
- ページには、US 英語で許容される音素は
- リリースページ の下部から .dict ファイルをダウンロードします。
-
この辞書で「Cartesia」の希望する発音に似た単語を探します。辞書には次のエントリがあります。
cartesian 0.99 0.14 1.0 1.0 kʰ ɑ ɹ tʲ i ʒ ə n -
中央の数値 4 列は無視します。「-an」に対応する発音部分を切り取り、「uh」の音に置き換えたいと考えます。MFA の「uh」音素は
ɐであることを知っています (もし知らなければ、辞書で「uh」を検索することもできます)。したがって希望する発音はkʰ ɑ ɹ tʲ i ʒ ɐです。 -
音素をパイプ文字で区切り、空白を入れずに山括弧で囲みます。したがって、原稿は
This is a generation from <<kʰ|ɑ|ɹ|tʲ|i|ʒ|ɐ>>となります。
(非推奨) Sonic 独自 IPA
Sonic 独自 IPA はsonic 専用であり、最新のモデル (sonic-2 と sonic-turbo) のユーザーは MFA スタイル IPA を使用してください。
以下は Sonic 独自 IPA の発音ガイドです。
ほとんどの音素は Wikipedia の英語音韻論の記事 に従っていますが、モデルが想定とは異なる表記を必要とする箇所では、欄外に青い <= を付けています。
これらの珍しい記号は、元のこちらのチャートからコピー&ペーストすることもできます。

ストレスと母音長の記号
Sonic English は、第 1 (ˈ) と第 2 (ˌ) ストレスのある音節に対するストレス記号を必要とし、これらは母音の直前に配置します。母音の長さ (ː) のアノテーションも使用します。モデルはこれらなしでも動作しますが、これらを使用するとロバストネスと制御性が顕著に向上します。