速遞|智譜攜清言視頻通話功能亮相 2024 服貿會,開啓 AI 新體驗
9 月 12 至 16 日,在北京 國家會議中心和首鋼園區舉辦的 2024 年中國國際服務貿易交易會(服貿會) 中, 智譜將 展示多款最新產品,包括 旗下清言 A p p 近期 重磅推出 的 “視頻通話”功能 、清影 A I 生成視頻功能以及大模型開放平臺 big model.cn 等。
清言作爲首批上線的 C 端大模型產品,過去一年中以文字和語音形式與用戶互動。如今,清言迎來重大升級,解鎖了“眼睛”, 這是全球首個面向大衆用戶開放的視頻通話功能,讓用戶體驗到目前最前沿的AI/大模型技術,正式進入視頻通話時代。
清言視頻通話功能跨越文本、音頻和視頻三大模態,具備實時推理能力。用戶可以打開攝像頭,通過視頻通話窗口與清言交流,清言不僅能“看”到用戶畫面,還能聽懂指令並準確執行。
即使用戶頻繁打斷,清言也能迅速反應,帶來如同真人視頻通話的流暢體驗。另外可以用右下角小畫筆在畫面上劃重點,清言可以知道你着重讓它看的地方是哪。
使用方法也十分簡單,只需下載智譜清言APP, 點擊右下角的通話按鈕,進去之後再切換到視頻,就能開啓一個全新的世界與小智愉快暢談。
清言視頻通話功能可以成爲你生活、學習和工作中的得力助手。在生活方面,小智可以提供穿搭技巧、機器的使用方法、識別場景講述背景故事。
當大語言模型解鎖了“看見”和“說話”的能力,AI 在學習和生活中的應用更廣泛了。
首先,清言變身成了一位隨身的英語翻譯,以及能夠隨時隨地開展情景教學的英語老師。清言不僅能夠即時翻譯中英文,還能根據用戶所處的環境信息進行英語對話,並且協助糾正用戶的語音和語法錯誤。
其次,清言還可以是孩子們的“大眼百科”。孩子們可以用視頻拍攝環境,並且讓清言解釋環境中陌生的物體叫什麼、能做什麼、英語怎麼說等等。此外,清言還可以爲孩子們閱讀繪本故事、玩你畫我猜等遊戲,成爲孩子們益智啓蒙的最佳玩伴。
當然,有了視頻通話功能後,清言還可以成爲旅遊時隨時講解景點故事的導遊,也能爲視障人士提供識別環境的幫助。還有更多場景和功能,等待大家一同發現。
在工作當中,小智可以提供面試指導、會議中完成紀要和總結、分析複雜的數據圖表、實時解讀電腦屏幕的代碼。
小智還能成爲你的學習搭子,爲你提供學科作業輔導。
無聊時小智還能是你的知心朋友,與你聊天玩遊戲。
見證了視頻通話功能的強大之外,智譜近期推出的視頻生成模型 CogVideoX 以及在智譜清言 App 上線的“清影”功能也吸引了不少觀衆駐足打卡。
據瞭解,清影面向所有用戶開放,只需輸入文本或上傳圖片,30 秒內即可生成 6 秒視頻。今年 7 月,清影上線清言 App,六天時間用戶生成超過 100 萬支視頻。
實際上最近一段時間以來智譜動作頻頻,稱得上是技術動作最密集的大模型公司:一週前,智譜剛剛在 KDD 上發佈了升級版基座大模型 GLM-4-Plus,以及CogView-3-Plus 和 CogVLM 在內的多模態模型,展示智譜對圖像、視頻等更多模態方面的研究進展,這正是業界公認的大模型的下一步。
同時,類 GPT-4o 的視頻通話功能在 C 端產品智譜清言上率先上線。7 月,智譜生視頻功能清影 Ying 上線智譜清言,並很快將其背後的生視頻模型 CogVideoX 開源。通過大模型鏈接物理世界億級用戶,智譜致力於爲千行百業帶來持續創新與變革,加速邁向通用人工智能時代。