☰

快手加入大模型應用戰

作者 | 劉寶丹

編輯 | 周智宇

一個多月前，字節發佈了豆包大模型家族，直接將大模型價格帶入“釐時代”。如今，快手也搬出了壓箱底的大模型矩陣，盯上了工具應用。

7月6日，在“新AI·新應用·新生態”論壇上，快手大模型首次集體亮相，視頻生成大模型可靈、圖像生成大模型可圖等產品的多項新功能正式發佈。

快手高級副總裁、主站業務與社區科學線負責人蓋坤錶示，快手搭建了以快意語言大模型、推薦大模型、視覺生成大模型爲核心的大模型矩陣，覆蓋內容理解、分發、生成等多個層面，並深度服務快手的商業生態場景。

快手面向AI時代打出了自研+應用的大模型矩陣，重點在於快手本身的業務提效和業績增長。快手終於開始向大模型市場亮劍了。

亮相

千呼萬喚始出來，快手大模型終於亮相了。

在會上，快手宣佈，基於自研的視覺生成大模型產品可靈AI網頁端正式上線，這是可靈AI在一個月內迎來的第三次重大升級，意味着，普通用戶可以登錄網站進行功能試用。

可靈AI基礎模型也進行了升級，推出更加清晰的高畫質版，以及首尾幀控制、鏡頭控制等全新編輯能力。同時，創作者單次生成的文生視頻時長增加至10s，是業內對用戶開放使用可實現的最長時長。

據介紹，可靈以真實世界物理規則爲基準，生成的視頻展現出了電影級別的畫質與動態效果，甚至能夠模擬大幅度的物理運動，打破了傳統視頻生成技術的侷限，收穫了國內外的好評。

快手視覺生成與互動中心負責人萬鵬飛表示，可靈AI大模型最新發布的版本中，可靈在運動生成、生成時長、物理規律、視頻畫質、指令響應、圖生視頻、視頻可控性等七個方向的能力亮點實現進一步升級，可單次生成更高清更可控的10s及更長的視頻。

自從6月6日正式發佈文生視頻功能以來，可靈迎來了快速發展。在CVPR（IEEE國際計算機視覺與模式識別會議）期間，可靈推出了圖生視頻、視頻續寫等多項新功能。

本次論壇上，快手還正式宣佈，可圖將正式開源。

蓋坤介紹，可圖大模型集成了快手在大語言模型領域的深厚積累，通過數十億中文語料的訓練，成爲最懂中文的文生圖模型，其綜合性能超越了SDXL/SD3等開源模型以及Midjourney等閉源模型，樹立了中文場景下圖像生成的新標杆。

對於開源動作，蓋坤錶示，這一舉措旨在激發行業活力，共建一個更爲繁榮的文生圖大模型社區生態。

前景

從一開始，快手就很明確，大模型的核心目標是爲快手體系內的場景和商業化而服務。

這主要體現在兩個方面，一是內容生產，快手意在打造“新一代AIGC創作、素材工具”和低門檻、智能化的內容生產體驗；二是內容消費，快手打算升級內容理解和分發體系，提升用戶的消費體驗。

前者主要服務於快手的商業化效率。據瞭解，基於快意大模型構建的視頻腳本生成工具，疊加數字人技術，助力快手商業化廣告主低成本生成視頻和直播內容，並提升線索轉化效率。

快手數據顯示，AIGC營銷素材在今年6月達到了單日消耗峰值突破2000萬的里程碑，展示了大模型在商業場景中的巨大潛力。

快手商業化外循環和AI商業產品負責人劉逍透露，半年來，有近2萬商家在快手平臺藉助大模型能力實現智能化經營。相比今年1月，今年6月的AIGC月活躍客戶數增長了8倍，月GMV規模提升了64倍，平臺AIGC廣告收入規模提升了12倍。

內容生產方面，更大的市場前景來自C端用戶和包含短劇在內的相關行業。

據蓋坤透露，截至目前，已有超過50萬用戶申請可靈的內測資格，視頻生成數量達700萬，尤其用戶通過“可靈”創造的“老照片復活”等作品，因爲觸動人心的力量火爆全網。

在3月的年度業績電話會上，快手創始人兼首席執行官程一笑表示，2023年公司啓動AI戰略後，一步步推進自研大模型的研發訓練。對於文生視頻，快手已於去年底推進專項研發。

“這對短視頻生態是巨大的機會，未來快手會把生成模型和生產者工具結合起來，不斷幫助創作者降低創作門檻，提升短視頻製作質量和效率。”程一笑如是強調。

行業方面，快手大模型已經率先用在了短劇生產上，由可靈提供深度技術支持的國內首部AIGC原創奇幻短劇《山海奇鏡之劈波斬浪》已經發布預告片，不日即將上線。

對此，快手副總裁、大模型團隊負責人張迪表示，“可能半年以前，大家都沒法想象真正用AIGC來製作電影，（現在它）來了！”在他看來，利用AI技術可大幅度提高短劇生產、製作和運營的效率。

內容消費方面，發揮更大作用的是推薦大模型SIM。據蓋坤介紹，該模型憑藉十萬億參數的規模，成爲全球領先的推薦系統之一。其下一代架構ACT預計每日將爲快手App增加4億分鐘的用戶觀看時長，顯著提升用戶粘性和活躍度。

對於未來，快手非常篤定，蓋坤錶示，快手未來將繼續加大在AI領域的投入，大力推動技術創新。

相關資訊