Gemini Live已在安卓端上線,將支持40多種語言

近日谷歌方面宣佈,旗下Gemini AI聊天機器人的Gemini Live功能將支持40多種語言,並率先支持法語、德語、葡萄牙語、印地語和西班牙語,後續會推出對更多語言的支持。同時,這一功能現已面向所有Android用戶開放。

據悉,Gemini Live支持用戶與Gemini進行語音交互,同時該功能採用了增強型語音引擎,可以使得Gemini展開更連貫、更有情感表現力、更逼真的多輪對話。用戶可在對話過程中隨時打斷,並提出新的問題或是更正信息,對此Gemini則會實時調整、並作出響應,從而提供更加自然流暢的對話體驗。

對此曾有相關報道指出,Gemini Live是谷歌爲了應對OpenAI在ChatGPT中引入高級語音模式(Advanced Voice Mode)而開發。有消息顯示,有測試者在使用過Gemini Live後表示,該語音助手在持續對話能力上明顯優於其他文本助手。

據瞭解,此前在9月初,谷歌方面就曾宣佈Gemini將在最新版本的更新中採用Gemini 1.5 Flash大模型(以下簡稱爲1.5 Flash)。據谷歌方面透露,其在改善延遲方面取得了重大進步,採用1.5 Flash的Gemini響應速度得到了大幅提升、增幅最高可達50%,更新後的Gemini可爲用戶帶來更加流暢、高效的體驗,從而幫助用戶以更少的時間來處理各種問題。

值得一提的是,不久前谷歌方面還對Gemini 1.5系列模型進行了更新,推出Gemini-1.5-Pro-002和Gemini-1.5-Flash-002兩款新的模型。據悉,這兩款模型的整體質量均得到了提升,具備更快的響應速度、更強大的性能,以及更低的成本。其中Gemini-1.5-Flash-002的延遲較此前版本降低了3倍,輸出速度提升了2倍。對此谷歌方面表示,這兩款模型能夠在保持內容安全標準的同時,提供更有幫助的回覆。

而在成本方面,Gemini-1.5-Pro-002和Gemini-1.5-Flash-002具備更簡潔的樣式,旨在易於使用、並降低成本。對於文本摘要、問答、信息提取等使用案例,據稱這兩款模型的默認輸出長度較此前版本縮短了5%至20%。

【本文圖片來自網絡】