英語のボイスエージェント向けにターン検出が改善された Ink 2 をぜひお試しください。
ink-whisper
Ink Whisper は Cartesia の最も手頃な音声認識モデルです。ベースラインの Whisper と比べてより高い精度と低レイテンシを実現します。
ベースラインの Whisper と比較した追加機能:
- ダイナミックチャンキングを使用して、可変長の音声チャンクや中断をスムーズに処理します。
- 背景ノイズのある音声を確実に書き起こします。
- テレフォニーアーティファクト、アクセント、発話の流暢でない部分を含む音声を正確に書き起こします。
- 固有名詞やドメイン固有の用語の書き起こしに優れています。
| スナップショット | リリース日 | 言語 | ステータス |
|---|---|---|---|
ink-whisper-2025-06-04 | June 4, 2025 | en, zh, de, es, ru, ko, fr, ja, pt, tr, pl, ca, nl, ar, sv, it, id, hi, fi, vi, he, uk, el, ms, cs, ro, da, hu, ta, no, th, ur, hr, bg, lt, la, mi, ml, cy, sk, te, fa, lv, bn, sr, az, sl, kn, et, mk, br, eu, is, hy, ne, mn, bs, kk, sq, sw, gl, mr, pa, si, km, sn, yo, so, af, oc, ka, be, tg, sd, gu, am, yi, lo, uz, fo, ht, ps, tk, nn, mt, sa, lb, my, bo, tl, mg, as, tt, haw, ln, ha, ba, jw, su, yue | Stable |