快手加入大模型應用戰
作者 | 劉寶丹
編輯 | 周智宇
一個多月前,字節發佈了豆包大模型家族,直接將大模型價格帶入“釐時代”。如今,快手也搬出了壓箱底的大模型矩陣,盯上了工具應用。
7月6日,在“新AI·新應用·新生態”論壇上,快手大模型首次集體亮相,視頻生成大模型可靈、圖像生成大模型可圖等產品的多項新功能正式發佈。
快手高級副總裁、主站業務與社區科學線負責人蓋坤錶示,快手搭建了以快意語言大模型、推薦大模型、視覺生成大模型爲核心的大模型矩陣,覆蓋內容理解、分發、生成等多個層面,並深度服務快手的商業生態場景。
快手面向AI時代打出了自研+應用的大模型矩陣,重點在於快手本身的業務提效和業績增長。快手終於開始向大模型市場亮劍了。
亮相
千呼萬喚始出來,快手大模型終於亮相了。
在會上,快手宣佈,基於自研的視覺生成大模型產品可靈AI網頁端正式上線,這是可靈AI在一個月內迎來的第三次重大升級,意味着,普通用戶可以登錄網站進行功能試用。
可靈AI基礎模型也進行了升級,推出更加清晰的高畫質版,以及首尾幀控制、鏡頭控制等全新編輯能力。同時,創作者單次生成的文生視頻時長增加至10s,是業內對用戶開放使用可實現的最長時長。
據介紹,可靈以真實世界物理規則爲基準,生成的視頻展現出了電影級別的畫質與動態效果,甚至能夠模擬大幅度的物理運動,打破了傳統視頻生成技術的侷限,收穫了國內外的好評。
快手視覺生成與互動中心負責人萬鵬飛表示,可靈AI大模型最新發布的版本中,可靈在運動生成、生成時長、物理規律、視頻畫質、指令響應、圖生視頻、視頻可控性等七個方向的能力亮點實現進一步升級,可單次生成更高清更可控的10s及更長的視頻。
自從6月6日正式發佈文生視頻功能以來,可靈迎來了快速發展。在CVPR(IEEE國際計算機視覺與模式識別會議)期間,可靈推出了圖生視頻、視頻續寫等多項新功能。
本次論壇上,快手還正式宣佈,可圖將正式開源。
蓋坤介紹,可圖大模型集成了快手在大語言模型領域的深厚積累,通過數十億中文語料的訓練,成爲最懂中文的文生圖模型,其綜合性能超越了SDXL/SD3等開源模型以及Midjourney等閉源模型,樹立了中文場景下圖像生成的新標杆。
對於開源動作,蓋坤錶示,這一舉措旨在激發行業活力,共建一個更爲繁榮的文生圖大模型社區生態。
前景
從一開始,快手就很明確,大模型的核心目標是爲快手體系內的場景和商業化而服務。
這主要體現在兩個方面,一是內容生產,快手意在打造“新一代AIGC創作、素材工具”和低門檻、智能化的內容生產體驗;二是內容消費,快手打算升級內容理解和分發體系,提升用戶的消費體驗。
前者主要服務於快手的商業化效率。據瞭解,基於快意大模型構建的視頻腳本生成工具,疊加數字人技術,助力快手商業化廣告主低成本生成視頻和直播內容,並提升線索轉化效率。
快手數據顯示,AIGC營銷素材在今年6月達到了單日消耗峰值突破2000萬的里程碑,展示了大模型在商業場景中的巨大潛力。
快手商業化外循環和AI商業產品負責人劉逍透露,半年來,有近2萬商家在快手平臺藉助大模型能力實現智能化經營。相比今年1月,今年6月的AIGC月活躍客戶數增長了8倍,月GMV規模提升了64倍,平臺AIGC廣告收入規模提升了12倍。
內容生產方面,更大的市場前景來自C端用戶和包含短劇在內的相關行業。
據蓋坤透露,截至目前,已有超過50萬用戶申請可靈的內測資格,視頻生成數量達700萬,尤其用戶通過“可靈”創造的“老照片復活”等作品,因爲觸動人心的力量火爆全網。
在3月的年度業績電話會上,快手創始人兼首席執行官程一笑表示,2023年公司啓動AI戰略後,一步步推進自研大模型的研發訓練。對於文生視頻,快手已於去年底推進專項研發。
“這對短視頻生態是巨大的機會,未來快手會把生成模型和生產者工具結合起來,不斷幫助創作者降低創作門檻,提升短視頻製作質量和效率。”程一笑如是強調。
行業方面,快手大模型已經率先用在了短劇生產上,由可靈提供深度技術支持的國內首部AIGC原創奇幻短劇《山海奇鏡之劈波斬浪》已經發布預告片,不日即將上線。
對此,快手副總裁、大模型團隊負責人張迪表示,“可能半年以前,大家都沒法想象真正用AIGC來製作電影,(現在它)來了!”在他看來,利用AI技術可大幅度提高短劇生產、製作和運營的效率。
內容消費方面,發揮更大作用的是推薦大模型SIM。據蓋坤介紹,該模型憑藉十萬億參數的規模,成爲全球領先的推薦系統之一。其下一代架構ACT預計每日將爲快手App增加4億分鐘的用戶觀看時長,顯著提升用戶粘性和活躍度。
對於未來,快手非常篤定,蓋坤錶示,快手未來將繼續加大在AI領域的投入,大力推動技術創新。