☰

階躍星辰推出國內首個千億參數端到端語音大模型“ Step-1o”

IT之家 12 月 14 日消息，階躍星辰昨日在公衆號宣佈推出 Step-1o 千億參數端到端語音大模型，據稱是“國內首個千億參數端到端語音大模型”。

據階躍星辰介紹，傳統的語音模型採用級聯方案，用戶輸入的語音信息需要先轉化爲文本，再二次轉化成語音輸出，這個過程不僅會降低傳輸效率、更會在過程中折損掉包括情緒在內的信息，導致語音模型時延長反應慢、回答質量和智能水平不足、情感表達空洞刻板的缺陷。但端到端的語音方案，可以實現語音理解和生成的一體化，提升模型智商和情商的上限。

IT之家從官方介紹獲悉，Step-1o 支持語音、文本等混合形式的輸入和輸出，可以快速反應並隨時打斷，它也能深度理解和模仿音色、韻律、方言、個性化的口語表達習慣等聲音特徵；

Step-1o 能夠通過自學和模仿不斷提升回覆質量，既能提供解決問題的專業建議，也能作爲提供高情緒價值的陪伴。此外，Step-1o 還傳承了階躍星辰語言大模型的創作能力。

階躍星辰透露，近期，Step-1o 將接入躍問 App 端，爲用戶提供實時語音通話服務。

階躍星辰推出國內首個千億參數端到端語音大模型“ Step-1o”

相關資訊