メインコンテンツへスキップ
Vision Agents ロゴ
StreamVision Agents をメンテナンスしています。これは、Stream の WebRTC エッジ上でリアルタイムメディアを扱う、音声・映像主導のエージェント向けのオープンソース Python フレームワークです。Cartesia は TTS プロバイダーとしてサポートされています。インストール手順、環境変数、パラメータは Stream の Cartesia インテグレーション に記載されています。 リアルタイムのトランスポートには Stream の開発者アカウントが、スピーチには Cartesia API キーが必要です。 GitHub の 「Simple Agent」 サンプル、および voice / video の入門ガイドが良い出発点になります。

デモ

Vision Agents Cartesia デモ

Simple Agent Cartesia デモを試してみてください。