
Sesame AI 是一家專注於自然語音互動技術的公司,致力於透過先進的對話語音模型與智慧硬體,為使用者提供更自然、富有情感的語音助理體驗。
其核心技術是對話語音模型(CSM),這是一個端到端的模型,旨在直接生成具有自然節奏、情感和語境感知的語音,而非簡單地將文本轉換為語音。
其語音助理(如 Maya 與 Miles)旨在模擬人類對話的細微特徵,包括情感回應、自然的停頓、語調變化,以提供更擬人化的互動體驗。
根據公開資訊,Sesame AI 提供研究預覽版本與線上示範供用戶體驗。具體的商業化模式、定價或高級功能費用需參考其官方的最新說明。
根據現有技術評測,其對話語音模型(CSM)目前主要針對英語優化,生成其他語言內容的品質可能有所不同。多語言支援情況建議查詢官方文檔。
根據其示範頁面說明,語音互動數據可能被臨時記錄用於品質保證,並會在一定期限後刪除。具體的資料處理政策與安全措施應查閱其官方的隱私條款。
傳統 TTS 通常是將生成的文本朗讀出來,而 Sesame 的 CSM 模型旨在從語音層面進行“思考”與生成,直接輸出帶有情感、節奏與語境連貫性的語音。
是的,Sesame 正在開發輕量級智慧眼鏡,旨在整合其 AI 語音助理,提供可穿戴的語音互動體驗,但目前具體上市時間與規格尚未完全公開。
可以,Sesame 已開源其 CSM 模型的 1B 參數版本(CSM-1B),開發者可以取得並在符合授權條款的前提下進行使用、研究與二次開發。

Resemble AI 是一家面向企業的 AI 語音生成與深偽偵測平台,提供從語音內容創作到安全防護的一體化可信賴 AI 基礎設施。核心服務包含高品質語音克隆、文字轉語音(TTS)、音訊增強與多模態深偽偵測,協助企業高效製作語音內容並應對 AI 生成內容帶來的安全風險。