階躍星辰推出國內首個千億參數端到端語音大模型“ Step-1o”

IT之家 12 月 14 日消息,階躍星辰昨日在公衆號宣佈推出 Step-1o 千億參數端到端語音大模型,據稱是“國內首個千億參數端到端語音大模型”。

據階躍星辰介紹,傳統的語音模型採用級聯方案,用戶輸入的語音信息需要先轉化爲文本,再二次轉化成語音輸出,這個過程不僅會降低傳輸效率、更會在過程中折損掉包括情緒在內的信息,導致語音模型時延長反應慢、回答質量和智能水平不足、情感表達空洞刻板的缺陷。但端到端的語音方案,可以實現語音理解和生成的一體化,提升模型智商和情商的上限。

IT之家從官方介紹獲悉,Step-1o 支持語音、文本等混合形式的輸入和輸出,可以快速反應並隨時打斷,它也能深度理解和模仿音色、韻律、方言、個性化的口語表達習慣等聲音特徵;

Step-1o 能夠通過自學和模仿不斷提升回覆質量,既能提供解決問題的專業建議,也能作爲提供高情緒價值的陪伴。此外,Step-1o 還傳承了階躍星辰語言大模型的創作能力。

階躍星辰透露,近期,Step-1o 將接入躍問 App 端,爲用戶提供實時語音通話服務。