メインコンテンツへスキップ
Cartesia はファーストパーティのスピーチ API と SDK を提供し、多くの他社製品や開発者向けフレームワークと連携しています。このセクションの各ページでは各経路を高レベルで説明します。詳細なセットアップ手順は通常、パートナー側のドキュメントやリポジトリにあります。

前提条件

以下は、ほぼすべてのインテグレーションで必要になります。各ページでは追加で必要なもの(パートナーアカウント、ランタイム、SDK のインストールなど)も記載しています。

パートナーインテグレーション

LiveKit

リアルタイムのルームとエージェント — LiveKit Inference または Cartesia プラグイン経由で Cartesia を利用できます。

Pipecat

公式 Cartesia TTS/STT サービスを使う Python 製の音声・マルチモーダルエージェント。

Twilio

Programmable Voice と Media Streams で Cartesia TTS を利用(Node のチュートリアル)。

Tencent RTC

TRTC のリアルタイムメディアと Cartesia を組み合わせた会話 AI ワークロード。

Thoughtly

ノーコードの電話エージェント。新規エージェントでは Cartesia がデフォルトのボイススタックです。

Rasa

Cartesia を TTS バックエンドとした Rasa Pro の音声アシスタント。

Vision Agents (by Stream)

Stream の Vision Agents フレームワークと Cartesia TTS プラグイン。

MCP

Cursor、Claude Desktop、その他の MCP クライアント向けの cartesia-mcp

コミュニティインテグレーション

サードパーティの開発者によって構築・メンテナンスされているものです。各ページには last_verified 日付が記載されています。コントリビュートしたい場合は community integrations リポジトリを参照してください。

Avaturn

Cartesia Line エージェントで動作する Avaturn アバターセッション。